开源中国 2023 大模型(LLM)技术报告
生成、文本摘要、翻译等任务中展现了强大的通用性。 本报告从技术人视角出发,将深入探讨 LLM 技术的背景、 基础设施、应用现状,以及相关的工具和平台。 2 / 32 LLM Tech Map 向量数据库 数据库向量支持 大模型框架、微调 (Fine Tuning) 大模型训练平台与工具 基础设施 LLM Agent 备案上线的中国大模型 知名大模型 知名大模型应用 大模型 04 向量数据库/数据库向量支持 为大模型提供高效的存储和检索能力 大模型框架及微调 (Fine Tuning) 大模型框架提供基本能力和普适性,而微调 则是实现特定应用和优化性能的关键环节 大模型训练平台&工具 提供了在不同硬件和环境中训练大语言模型 所需的基础设施和支持 编程语言 以 Python 为代表 5 / 32 LLM 基础设施:向量数据库/数据库向量支持 向量数据库是专门用于存储和检索向量数据的数据库,它可以为 LLM 提供高效的存储和检索能力。通过数据向量化,实现了 在向量数据库中进行高效的相似性计算和查询。 根据向量数据库的的实现方式,可以将向量数据库大致分为两类: 原生的向量数据库专门为存储和检索向量而设计, 所管理的数据是基于对象或数据点的向量表示进行 组织和索引。 包括 等均属于原生向量数据库。 除了选择专业的向量数据库,对传统数据库添加0 码力 | 32 页 | 13.09 MB | 1 年前3【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502
政企、创业者必读政企、创业者必读 一张图读懂一堂DeepSeek课政企、创业者必读 AI给了一个比互联网更大的机会 互联网是连接平台,人工智能是生产力 互联网是赋能性技术,生产力属性较弱 人工智能既能单兵作战,也能外部赋能 互联网创造了能写140个字的推特和分享照片的Instagram AI能帮助人解决登陆火星、能源自由的问题 5政企、创业者必读 大模型是真智能,是人工智能的重大拐点。你相不相信? 大模 图像生成 视频生成 音频生成 A I 数字人 生物制药 新材料研究 脑机接口 基础科学 能源自由 宇宙探索 生命科学 科学 能力 6 AI Fo r Science 知识管理( 内部知识管理、 外部情报分析、 大数据分析、 工作流知识) 专家经验模型( 专业模型训练) 业务流程自动化( A g e n t框架) 组织协同( 工作流) 人机交互 赋能个人和 企业员工 生产力提升 多模态 知识自动汇集,不流失 多模态数据处理和理解 非结构化文档处理和理解 搜索,辅助内部办公和外部客户服务 为业务大模型RAG做准备 内部知识管理 • 把企业内部的碎片化知识, 把专 家头脑中的经验转化为显性知识 管理起来, 如员工邮件、 文档文 件、 聊天记录、 工作记录等 工作流知识管理 1 外部情报分析 • 抓取外部情报, 例如行业报告、 市 场情报等 2 多模态处理 • 用大模型多模态能力把非结构化0 码力 | 76 页 | 5.02 MB | 5 月前3清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单
能做什么? 要怎么做? 效果如何? 一 能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 通过数据清洗、数据集成、数据变换、特征工程等方式,实 现数据纠错、数据整合、格式转换、特征提取等。 对数据进行诊断、预测、关联、聚类分析,常用于问题 用户在不同科研需求下得到充分支持。 增强版绘图功能:增强版具备绘图功能,可通过可视化 图示(如文献关键词共现图)直观展示综述内容,帮助 用户更好理解和呈现研究成果。 无数据检索:以现有真实数据库作为支撑,通过关键词 检索,自动搜集相关文献并生成综述报告,目前只支持 英文检索。 低重复率:结合现有查重机制与AI技术,在内容生成阶 段引入重复检测与优化策略,从源头上降低重复率风险, 所生成的综述普通重复率与AIGC重复率均在5%以下。 无限双语数据导入:支持中文与英文文献的导入,并且 文献数据量没有限制,能够轻松处理中文文献的系统性 梳理,以及国际文献的跨语言分析。 幻觉克服:以现有真实数据库作为支撑,借助由专家设 计撰写的提示词,精准规避AI生成中的幻觉问题。 高规范格式输出:所生成的综述文档格式规范、结构清 晰,符合学术论文标准,用户几乎无需进行二次整理。 中科院PubScholar平台0 码力 | 85 页 | 8.31 MB | 7 月前3DeepSeek从入门到精通(20250204)
幻觉类型 数据可用 性 理解 能力 深度 语境精 确度 外部信息 整合能力 逻辑推理和 抽象能力 典型错误表现 数据误用 有数据 低 高 高 中 误用已有数据,回答 部分不符或细节错误 语境误解 有数据 高 低 高 中 对问题的意图理解错 误,回答偏离主题 信息缺失 无数据 中 高 低 中 未能正确获取或整合 外部信息 推理错误 部分数据 高 高 中 低 逻辑推理中存在漏洞 或错误假设 应对威胁。 c.解释签名式防御如何类似于抗体,能够快速识别和中和已知威胁。 d.比较系统隔离和清理过程与人体发烧的相似性,都是为了控制“感染”扩散。 e.讨论威胁情报数据库如何类似于免疫记忆,使系统能够更快地应对重复出现的威胁。 (3)深入探讨启示: a.分析免疫系统的适应性如何启发自适应安全系统的设计。 b.探讨免疫系统的分层防御策略如何应用于网络安全的纵深防御概念。 开展和目标达成。请遵循 以下要求: 1. 执行摘要(300字内):概括整个执行方案的核心内容、主要目标和关键成 功因素。 2. 项目团队构成(300字内):列出核心项目团队成员,包括内部人员和外部 合作方。明确每个角色的主要职责和决策权限。 3. 里程碑规划(1200字内):设定5—7个关键里程碑事件。每个里程碑都应包 含具体目标、完成标准和时间节点。使用甘特图呈现整体时间线。 4.0 码力 | 104 页 | 5.37 MB | 7 月前3清华大学 DeepSeek 从入门到精通
幻觉类型 数据可用 性 理解 能力 深度 语境精 确度 外部信息 整合能力 逻辑推理和 抽象能力 典型错误表现 数据误用 有数据 低 高 高 中 误用已有数据,回答 部分不符或细节错误 语境误解 有数据 高 低 高 中 对问题的意图理解错 误,回答偏离主题 信息缺失 无数据 中 高 低 中 未能正确获取或整合 外部信息 推理错误 部分数据 高 高 中 低 逻辑推理中存在漏洞 或错误假设 应对威胁。 c.解释签名式防御如何类似于抗体,能够快速识别和中和已知威胁。 d.比较系统隔离和清理过程与人体发烧的相似性,都是为了控制“感染”扩散。 e.讨论威胁情报数据库如何类似于免疫记忆,使系统能够更快地应对重复出现的威胁。 (3)深入探讨启示: a.分析免疫系统的适应性如何启发自适应安全系统的设计。 b.探讨免疫系统的分层防御策略如何应用于网络安全的纵深防御概念。 开展和目标达成。请遵循 以下要求: 1. 执行摘要(300字内):概括整个执行方案的核心内容、主要目标和关键成 功因素。 2. 项目团队构成(300字内):列出核心项目团队成员,包括内部人员和外部 合作方。明确每个角色的主要职责和决策权限。 3. 里程碑规划(1200字内):设定5—7个关键里程碑事件。每个里程碑都应包 含具体目标、完成标准和时间节点。使用甘特图呈现整体时间线。 4.0 码力 | 103 页 | 5.40 MB | 8 月前3人工智能安全治理框架 1.0
2.2 现实域安全风险 (a)诱发传统经济社会安全风险。人工智能应用于金融、能源、电信、交通、 民生等传统行业领域,如自动驾驶、智能诊疗等,模型算法存在的幻觉输出、 错误决策,以及因不当使用、外部攻击等原因出现系统性能下降、中断、失控 等问题,将对用户人身生命财产安全、经济社会安全稳定等造成安全威胁。 (b)用于违法犯罪活动的风险。人工智能可能被利用于涉恐、涉暴、涉赌、 涉毒等传统违法 生产关系的大幅改变,加速重构传统行业模式,颠覆传统的就业观、生育观、 教育观,对传统社会秩序的稳定运行带来挑战。 (c)未来脱离控制的风险。随着人工智能技术的快速发展,不排除人工 智能自主获取外部资源、自我复制,产生自我意识,寻求外部权力,带来谋求 与人类争夺控制权的风险。 4. 技术应对措施 针对上述安全风险,模型算法研发者、服务提供者、系统使用者等需从 训练数据、算力设施、模型算法、产品服务、应用场景各方面采取技术措施予0 码力 | 20 页 | 3.79 MB | 29 天前3DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model
CMMLU. 40 PROMPT 文章:英雄广场(Heldenplatz)是奥地利首都维也纳的一个广场。在此曾发 生许多重要事件— 最著名的是1938年希特勒在此宣告德奥合并。英雄广场是 霍夫堡皇宫的外部广场,兴建于皇帝弗朗茨·约瑟夫一世统治时期,是没有完 全建成的所谓“帝国广场”(Kaiserforum)的一部分。其东北部是霍夫堡皇宫 的Leopoldinian Tract,东南方是新霍夫堡,西南方的内环路,将其与“城门 Burgtor)隔开。西北部没有任何建筑物,可以很好地眺望内环 路、国会大厦、市政厅,以及城堡剧院。广场上有2尊军事领袖的骑马像:欧 根亲王和卡尔大公。 根据上文回答下面的问题。 问题:英雄广场是哪个皇宫的外部广场? 答案:霍夫堡皇宫 问题:广场上有哪两位军事领袖的骑马像? 答案: Table 20 | An example of CMRC2018. PROMPT Passage: The median0 码力 | 52 页 | 1.23 MB | 1 年前3DeepSeek图解10页PDF
型进行微调,以适应特定任务,如行业术语、企业内部知识库等。 3. 离线运行,适用于无网络环境。可在离线环境下运行:适用于无互联网 连接或网络受限的场景。提高系统稳定性:即使云服务宕机,本地大模型依 然可以正常工作,不受外部因素影响。 本教程搭建 DeepSeek 好处 本地搭建 DeepSeek 三个比较实际的好处: • 本教程接入的是 DeepSeek 推理模型 R1,开源免费,性能强劲 • 本教程搭建方法0 码力 | 11 页 | 2.64 MB | 7 月前3普通人学AI指南
AI 编程开发助手,集成在 JetBrains 系列开发工具中,提升编码效率。 9 Figure 6: AI 编程工具 2.4.3 AirOps 用于生成和修改 SQL 语句的工具,旨在简化数据库操作。 2.4.4 ChatDev 面壁智能开发的 AI 智能体开发平台,支持创建和部署智能对话系统。 2.4.5 solo Mozilla 开源项目,提供零代码网站开发功能,易于使用。 20 码力 | 42 页 | 8.39 MB | 7 月前3
共 9 条
- 1