面向对象编程 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

开源中国 2023 大模型(LLM)技术报告

Agent  备案上线的中国大模型  知名大模型  知名大模型应用大模型算力工具和平台  LLMOps  大模型聚合平台  开发工具 AI 编程  插件、IDE、终端  代码生成工具编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心，随着大规模语言数据集的可用性和计算能力的提升，研究者们开 (Fine Tuning) 大模型框架提供基本能力和普适性，而微调则是实现特定应用和优化性能的关键环节大模型训练平台&工具提供了在不同硬件和环境中训练大语言模型所需的基础设施和支持编程语言以 Python 为代表 5 / 32 LLM 基础设施：向量数据库/数据库向量支持向量数据库是专门用于存储和检索向量数据的数据库，它可以为 LLM 提供高效的存储和检索能力。通过数据向量化，实现了提供高效的存储和检索能力。通过数据向量化，实现了在向量数据库中进行高效的相似性计算和查询。根据向量数据库的的实现方式,可以将向量数据库大致分为两类：原生的向量数据库专门为存储和检索向量而设计，所管理的数据是基于对象或数据点的向量表示进行组织和索引。包括等均属于原生向量数据库。除了选择专业的向量数据库，对传统数据库添加 “向量支持”也是主流方案。比如等传统数据库均已支持向量检索。 6 / 32

0 码力 | 32 页 | 13.09 MB | 1 年前
3
清华大学普通人如何抓住DeepSeek红利

j i 6 n p Y d O w t v B 4 G 0 G p y 8 U I q e T 9 M 6 Deepseek的能力图谱直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。决策支持文体转换让AI用类比解释： “请用‘水管流速’比喻说明隐函数求导中dy/dx的意义。” Ø 生成记忆口诀： “把隐函数求导步骤编成顺口溜，包含‘遇y先写 dy/dx’等关键词。” 场景2：文科生快速上手编程加载数据集：使用datasets库加载SQuAD数据集，这个数据集包含了大量基于2020年之前数据生成的问答对。提取问题：从数据集中提取问题，并使用set去重。检查问题数量：确保提取的问题数量至少为10万个。目标：在不伤害长辈感情的情况下，妥善处理亲戚的催婚问题，维护家庭和谐，同时保护自己的个人空间和选择。对话技巧 p 使用“我”语句：如“我感到…”，避免指责。 p 运用幽默：如“现在我还是专心工作，等以后有了对象再来麻烦您操心！” p 避免冲突：寻找共同点，如“您说得对，婚姻很重要，我会认真考虑的。” p 提前沟通：与父母提前商量，减少惊讶。妥善处理策略 p 表达感激，建立沟通基础示例：微笑着回应，“谢谢您关心，我很感激您的爱

0 码力 | 65 页 | 4.47 MB | 8 月前
3
国家人工智能产业综合标准化体系建设指南（2024版）

项以上，促进人工智能产业全球化发展。坚持创新驱动。优化产业科技创新与标准化联动机制，加快人工智能领域关键共性技术研究，推动先进适用的科技创新成果高效转化成标准。坚持应用牵引。坚持企业主体、市场导向，面向行业应用需求，强化创新成果迭代和应用场景构建，协同推进人工 3 智能与重点行业融合应用。坚持产业协同。加强人工智能全产业链标准化工作协同，加强跨行业、跨领域标准化技术组织的协作，打造大中成熟度评估，人工智能通用性测试指南、评估原则和等级要求，企业智能化能力框架及测评要求等标准。 4. 管理标准。规范人工智能技术、产品、系统、服务等全生命周期涉及的人员、组织管理要求和评价，包括面向人工智能组织的管理要求，人工智能管理体系、分类方法、评级流程等标准。 5. 可持续标准。规范人工智能影响环境的技术框架、方法和指标，平衡产业发展与环境保护，包括促进生态可持续的人工基础数据服务标准。规范人工智能研发、测试、应用等过程中涉及数据服务的要求，包括数据采集、数据标注、数据治理、数据质量等标准。 2. 智能芯片标准。规范智能芯片相关的通用技术要求，包括智能芯片架构、指令集、统一编程接口及相关测试要求、芯片数据格式和协议等标准。 3. 智能传感器标准。规范单模态、多模态新型传感器的接口协议、性能评定、试验方法等技术要求，包括智能传感器的架构、指令、数据格式、信息提取方法、信息融合方法、功能集成

0 码力 | 13 页 | 701.84 KB | 1 年前
3
人工智能安全治理框架 1.0

智能技术自身、人工智能应用两方面分析梳理安全风险，提出针对性防范应对措施。关注安全风险发展变化，快速动态精准调整治理措施，持续优化治理机制和方式，对确需政府监管事项及时予以响应。 1.3 技管结合、协同应对。面向人工智能研发应用全过程，综合运用技术、管理相结合的安全治理措施，防范应对不同类型安全风险。围绕人工智能研发应用生态链，明确模型算法研发者、服务提供者、使用者等相关主体的安全责任，有机发挥形态安全和伦理安全。如果用户输入的提示词存在不良内容，在模型安全防护机制不完善的情况下，有可能输出违法有害内容。（b）混淆事实、误导用户、绕过鉴权的风险。人工智能系统及输出内容等未经标识，导致用户难以识别交互对象及生成内容来源是否为人工智能系统，难以鉴别生成内容的真实性，影响用户判断，导致误解。同时，人工智能生成图片、音频、视频等高仿真内容，可能绕过现有人脸识别、语音识别等身份认证机制，导致认证鉴权失效。系统被滥用。对算力、推理能力达到一定阈值或应用在特定行业领域的人工智能系统进行登记备案，要求其具备在设计、研发、测试、部署、使用、维护等全生命周期的安全防护能力。 5.2 建立人工智能服务可追溯管理制度。对面向公众服务的人工智能系统，通过数字证书技术对其进行标识管理。制定出台人工智能生成合成内容标识标准规范，明确显式、隐式等标识要求，全面覆盖制作源头、传播路径、分发渠道等关键环节，便于用户识别判断信息来源及真实性。-

0 码力 | 20 页 | 3.79 MB | 1 月前
3
DeepSeek从入门到精通(20250204)

DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成表格、列表生成（如日程安排、菜谱）因果分析（事件关联性）语义分析语义解析情感分析（评论、反馈）意图识别（客服对话、用户查询）实体提取（人名、地点、事件）文本分类文本分类主题标签生成（如新闻分类）垃圾内容检测编程与代码相关代码调试 • 错误分析与修复建议 • 代码性能优化提示技术文档处理 • API文档生成 • 代码库解释与示例生成代码生成 • 根据七“特” AIGC评测：2个国家级项目+1套自动化测评系统 AIGC评测指标体系共计26个细分指标两项国家级项目： • 2023国家自然科学基金青年项目“面向人工智能生成内容的风险识别与治理策略研究” • 2023国家资助博士后研究人员计划B档“AIGC意识形态安全评估” 创新的火花：如何设计出独具匠心的提示语？抽象—具体循环法：在不同抽象层次间灵活切换

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成表格、列表生成（如日程安排、菜谱）因果分析（事件关联性）语义分析语义解析情感分析（评论、反馈）意图识别（客服对话、用户查询）实体提取（人名、地点、事件）文本分类文本分类主题标签生成（如新闻分类）垃圾内容检测编程与代码相关代码调试 • 错误分析与修复建议 • 代码性能优化提示技术文档处理 • API文档生成 • 代码库解释与示例生成代码生成 • 根据七“特” AIGC评测：2个国家级项目+1套自动化测评系统 AIGC评测指标体系共计26个细分指标两项国家级项目： • 2023国家自然科学基金青年项目“面向人工智能生成内容的风险识别与治理策略研究” • 2023国家资助博士后研究人员计划B档“AIGC意识形态安全评估” 创新的火花：如何设计出独具匠心的提示语？抽象—具体循环法：在不同抽象层次间灵活切换

0 码力 | 103 页 | 5.40 MB | 8 月前
3
普通人学AI指南

. . . . . . . . . 9 2.3.9 EBSynth . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4 AI 编程工具 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4.1 DEvv . . . . . . . . . . . 工具太多，种类太多，老的还没用，新的就出来，头大得很！有没有这种感觉？所以，在这一章，梳理主流的 AI 工具，注意不是穷举，那些不经常用的工具，不浪费文字和耽误时间。梳理总结六大类 AI 工具，分别包括：问答，图像，视频，AI 编程，AI 提示词和 AI 大模型，一共梳理挑选共计 38 个 AI 工具，其中很多都是开源！ 2.1 问答 2.1.1 ChatGPT ChatGPT 是一个由 OpenAI 开发的大型语言模型，它基于开源：一个开源的视频处理工具，用于将艺术风格应用到视频帧中。 2.4 AI 编程工具 2.4.1 DEvv 程序员的新一代 AI 搜索引擎，专为编程和技术问题检索设计。 2.4.2 JetBrains AI AI 编程开发助手，集成在 JetBrains 系列开发工具中，提升编码效率。 9 Figure 6: AI 编程工具 2.4.3 AirOps 用于生成和修改 SQL 语句的工具，旨在简化数据库操作。

0 码力 | 42 页 | 8.39 MB | 8 月前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

和办公工具，提升企业竞争力。 • 开源AI教育平台：借助DeepSeek R1 的低成本特性，创建开源AI教育平台，提供免费课程和实验资源，促进AI教育普及。 • 智能编程教育助手：为编程学生提供实时编程指导，自动生成代码示例，帮助解决编程难题。 • 自动化代码审查工具：自动审查代码，发现潜在问题并提供优化建议，提升开发效率与代码质量。新思路：Open AI o3mini的数据应用模型在训练过程中，通过强化学习技术，显著提升模型的推理能力，使其在数学、编程和自然语言推理等任务上表现出色。传统依赖：大规模监督微调（SFT）创新思路：强化学习（RL）驱动  推理效率 • 长思维链支持：DeepSeek R1 支持长链推理，能够生成数万字的思维链，显著提高复杂任务的推理准确性，其长链推理能力在数学、编程和自然语言推理等任务中表现出色。 • 多模态任务处理：DeepSeek OpenAI-o1-1217；在 MATH-500 测试中，取得 97.3%，表现与 OpenAI-o1-1217 相当，远超其他模型。 • 代码生成能力达专家级水平：DeepSeek R1在编程任务中，Elo评分达 2029，超越 96.3% 的人类参赛者；在工程任务中DeepSeek-R1表现略优于 DeepSeek V3，这对开发人员在实际任务中有潜在帮助。  知识类任务表现

0 码力 | 85 页 | 8.31 MB | 8 月前
3
清华大学第二弹：DeepSeek赋能职场

DeepSeek 三种模式对比 • 基础模型（V3）：通用模型（2024.12），高效便捷，适用于绝大多数任务，“ ”任务 • 深度思考（R1）：推理模型，复杂推理和深度分析任务，如数理逻辑推理和编程代码，“ ”任务 • 联网搜索：RAG（检索增强生成），知识库更新至 DeepSeek 两种模型对比操作规范清晰且对结果有明确要求操作路径多元、开放，且对结果没有明确要求 DeepSeek

0 码力 | 35 页 | 9.78 MB | 8 月前
3
DeepSeek图解10页PDF

4: Ollama 软件启动 deepseek-r1 界面 1.3 DeepSeek 本地运行使用演示基于上面步骤搭建完成后，接下来提问 DeepSeek 一个问题：请帮我分析 Python 编程如何从零开始学习?，下面是它的回答，首先会有一个 think 标签，这里面嵌入的是它的思考过程，不是正式的回复：图 5: deepseek-r1 回复之思考部分等我们看到另一个结束标签 think

0 码力 | 11 页 | 2.64 MB | 8 月前
3

共 11 条前往

页

分类

语言

格式