开源中国 2023 大模型(LLM)技术报告Agent  备案上线的中国大模型  知名大模型  知名大模型应用 大模型 算力 工具和平台  LLMOps  大模型聚合平台  开发工具 AI 编程  插件、IDE、终端  代码生成工具 编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能 力的提升,研究者们开 (Fine Tuning) 大模型框架提供基本能力和普适性,而微调 则是实现特定应用和优化性能的关键环节 大模型训练平台&工具 提供了在不同硬件和环境中训练大语言模型 所需的基础设施和支持 编程语言 以 Python 为代表 5 / 32 LLM 基础设施:向量数据库/数据库向量支持 向量数据库是专门用于存储和检索向量数据的数据库,它可以为 LLM 提供高效的存储和检索能力。通过数据向量化,实现了 提供高效的存储和检索能力。通过数据向量化,实现了 在向量数据库中进行高效的相似性计算和查询。 根据向量数据库的的实现方式,可以将向量数据库大致分为两类: 原生的向量数据库专门为存储和检索向量而设计, 所管理的数据是基于对象或数据点的向量表示进行 组织和索引。 包括 等均属于原生向量数据库。 除了选择专业的向量数据库,对传统数据库添加 “向量支持”也是主流方案。比如 等传 统数据库均已支持向量检索。 6 / 320 码力 | 32 页 | 13.09 MB | 1 年前3
 清华大学 普通人如何抓住DeepSeek红利j i 6 n p Y d O w t v B 4 G 0 G p y 8 U I q e T 9 M 6 Deepseek的能力图谱 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场 景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 决策支持 文体转换 让AI用类比解释: “请用‘水管流速’比喻说明隐函数求导中dy/dx的意 义。” Ø 生成记忆口诀: “把隐函数求导步骤编成顺口溜,包含‘遇y先写 dy/dx’等关键词。” 场景2:文科生快速上手编程 加载数据集:使用datasets库加载SQuAD数据集,这个数据 集包含了大量基于2020年之前数据生成的问答对。 提取问题:从数据集中提取问题,并使用set去重。 检查问题数量:确保提取的问题数量至少为10万个。 目标:在不伤害长辈感情的情况下,妥善处理亲戚的催婚问题,维护家庭和谐,同时保护自己的个人空间和选择。 对话技巧 p 使用“我”语句:如“我感到…”,避免指责。 p 运用幽默:如“现在我还是专心工作,等以后有了 对象再来麻烦您操心!” p 避免冲突:寻找共同点,如“您说得对,婚姻很重 要,我会认真考虑的。” p 提前沟通:与父母提前商量,减少惊讶。 妥善处理策略 p 表达感激,建立沟通基础 示例:微笑着回应,“谢谢您关心,我很感激您的爱0 码力 | 65 页 | 4.47 MB | 8 月前3
 国家人工智能产业综合标准化体系建设指南(2024版)项以上,促进人工智能产业全球 化发展。 坚持创新驱动。优化产业科技创新与标准化联动机制, 加快人工智能领域关键共性技术研究,推动先进适用的科技 创新成果高效转化成标准。 坚持应用牵引。坚持企业主体、市场导向,面向行业应 用需求,强化创新成果迭代和应用场景构建,协同推进人工 3 智能与重点行业融合应用。 坚持产业协同。加强人工智能全产业链标准化工作协 同,加强跨行业、跨领域标准化技术组织的协作,打造大中 成熟度评估,人工智能通用性测试指南、评估原则和等级要求, 企业智能化能力框架及测评要求等标准。 4. 管理标准。规范人工智能技术、产品、系统、服务等全 生命周期涉及的人员、组织管理要求和评价,包括面向人工智能 组织的管理要求,人工智能管理体系、分类方法、评级流程等标 准。 5. 可持续标准。规范人工智能影响环境的技术框架、方法 和指标,平衡产业发展与环境保护,包括促进生态可持续的人工 基础数据服务标准。规范人工智能研发、测试、应用等 过程中涉及数据服务的要求,包括数据采集、数据标注、数据治 理、数据质量等标准。 2. 智能芯片标准。规范智能芯片相关的通用技术要求,包 括智能芯片架构、指令集、统一编程接口及相关测试要求、芯片 数据格式和协议等标准。 3. 智能传感器标准。规范单模态、多模态新型传感器的接 口协议、性能评定、试验方法等技术要求,包括智能传感器的架 构、指令、数据格式、信息提取方法、信息融合方法、功能集成0 码力 | 13 页 | 701.84 KB | 1 年前3
 人工智能安全治理框架 1.0智能技术自身、人工智能应用两方面分析梳理安全风险,提出针对性防范应对 措施。关注安全风险发展变化,快速动态精准调整治理措施,持续优化治理机 制和方式,对确需政府监管事项及时予以响应。 1.3 技管结合、协同应对。面向人工智能研发应用全过程,综合运用技术、 管理相结合的安全治理措施,防范应对不同类型安全风险。围绕人工智能研发 应用生态链,明确模型算法研发者、服务提供者、使用者等相关主体的安全责 任,有机发挥 形态安全和伦理安全。如果用户输入的提示词存在不良内容,在模型安全防护 机制不完善的情况下,有可能输出违法有害内容。 (b)混淆事实、误导用户、绕过鉴权的风险。人工智能系统及输出内容 等未经标识,导致用户难以识别交互对象及生成内容来源是否为人工智能系统, 难以鉴别生成内容的真实性,影响用户判断,导致误解。同时,人工智能生成 图片、音频、视频等高仿真内容,可能绕过现有人脸识别、语音识别等身份认 证机制,导致认证鉴权失效。 系统被滥用。对算力、推理能力达到一定阈值或应用在特定行业领域的人工智 能系统进行登记备案,要求其具备在设计、研发、测试、部署、使用、维护等 全生命周期的安全防护能力。 5.2 建立人工智能服务可追溯管理制度。对面向公众服务的人工智能 系统,通过数字证书技术对其进行标识管理。制定出台人工智能生成合成内容 标识标准规范,明确显式、隐式等标识要求,全面覆盖制作源头、传播路径、 分发渠道等关键环节,便于用户识别判断信息来源及真实性。-0 码力 | 20 页 | 3.79 MB | 1 月前3
 DeepSeek从入门到精通(20250204)DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应 用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据 七“特” AIGC评测:2个国家级项目+1套自动化测评系统 AIGC评测 指标体系 共计26个细分指标 两项国家级项目: • 2023国家自然科学基金青年项目“面向人工智能生成内 容的风险识别与治理策略研究” • 2023国家资助博士后研究人员计划B档“AIGC意识形态 安全评估” 创新的火花:如何设计出独具匠心的提示语? 抽象—具体循环法:在不同抽象层次间灵活切换0 码力 | 104 页 | 5.37 MB | 8 月前3
 清华大学 DeepSeek 从入门到精通DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应 用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据 七“特” AIGC评测:2个国家级项目+1套自动化测评系统 AIGC评测 指标体系 共计26个细分指标 两项国家级项目: • 2023国家自然科学基金青年项目“面向人工智能生成内 容的风险识别与治理策略研究” • 2023国家资助博士后研究人员计划B档“AIGC意识形态 安全评估” 创新的火花:如何设计出独具匠心的提示语? 抽象—具体循环法:在不同抽象层次间灵活切换0 码力 | 103 页 | 5.40 MB | 8 月前3
 普通人学AI指南. . . . . . . . . 9 2.3.9 EBSynth . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4 AI 编程工具 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4.1 DEvv . . . . . . . . . . . 工具太多,种类太多,老的还没用,新的就出来,头大得 很!有没有这种感觉?所以,在这一章,梳理主流的 AI 工具,注意不是穷举, 那些不经常用的工具,不浪费文字和耽误时间。 梳理总结六大类 AI 工具,分别包括:问答,图像,视频,AI 编程,AI 提 示词和 AI 大模型,一共梳理挑选共计 38 个 AI 工具,其中很多都是开源! 2.1 问答 2.1.1 ChatGPT ChatGPT 是一个由 OpenAI 开发的大型语言模型,它基于 开源:一个开源的视频处理工具,用于将艺术风格应用到视频帧中。 2.4 AI 编程工具 2.4.1 DEvv 程序员的新一代 AI 搜索引擎,专为编程和技术问题检索设计。 2.4.2 JetBrains AI AI 编程开发助手,集成在 JetBrains 系列开发工具中,提升编码效率。 9 Figure 6: AI 编程工具 2.4.3 AirOps 用于生成和修改 SQL 语句的工具,旨在简化数据库操作。0 码力 | 42 页 | 8.39 MB | 8 月前3
 清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单和办公工具,提升企业竞争力。 • 开源AI教育平台:借助DeepSeek R1 的低成本特性,创建开源AI教育平台,提供 免费课程和实验资源,促进AI教育普及。 • 智能编程教育助手:为编程学生提供实 时编程指导,自动生成代码示例,帮助解决 编程难题。 • 自动化代码审查工具:自动审查代码, 发现潜在问题并提供优化建议,提升开发效 率与代码质量。 新思路:Open AI o3mini的数据应用 模型在训练过程中,通过强化学习技术,显著提升模型的推理能力, 使其在数学、编程和自然语言推理等任务上表现出色。 传统依赖: 大规模监督微调(SFT) 创新思路: 强化学习(RL)驱动  推理效率 • 长思维链支持:DeepSeek R1 支持长链推理,能够生成数万字的 思维链,显著提高复杂任务的推理准确性,其长链推理能力在数学、 编程和自然语言推理等任务中表现出色。 • 多模态任务处理:DeepSeek OpenAI-o1-1217;在 MATH-500 测试 中,取得 97.3%,表现与 OpenAI-o1-1217 相当,远超其他模型。 • 代码生成能力达专家级水平:DeepSeek R1在编程任务中,Elo评分达 2029,超越 96.3% 的人类参赛者;在工程任务中DeepSeek-R1表现略优 于 DeepSeek V3,这对开发人员在实际任务中有潜在帮助。  知识类任务表现0 码力 | 85 页 | 8.31 MB | 8 月前3
 清华大学第二弹:DeepSeek赋能职场DeepSeek 三种模式对比 • 基础模型(V3):通用模型(2024.12),高效便捷,适用于绝大多数任务,“ ”任务 • 深度思考(R1):推理模型,复杂推理和深度分析任务,如数理逻辑推理和编程代码,“ ”任务 • 联网搜索:RAG(检索增强生成),知识库更新至 DeepSeek 两种模型对比 操作规范清晰 且对结果有明确要求 操作路径多元、开放, 且对结果没有明确要求 DeepSeek0 码力 | 35 页 | 9.78 MB | 8 月前3
 DeepSeek图解10页PDF4: Ollama 软件启动 deepseek-r1 界面 1.3 DeepSeek 本地运行使用演示 基于上面步骤搭建完成后,接下来提问 DeepSeek 一个问题:请帮我分析 Python 编程如何从零开始学习?,下面是它的回答,首先会有一个 think 标签,这里面嵌入的是它的思考过程,不是正式的回复: 图 5: deepseek-r1 回复之思考部分 等我们看到另一个结束标签 think0 码力 | 11 页 | 2.64 MB | 8 月前3
共 11 条
- 1
 - 2
 













