2024 中国开源开发者报告Agent 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 | 推理中心化:构建未来 AI 基础设施的关键 Part 1:中国开源开发者生态数据 04 生产力-协作开发指数 本部分图表仅用于数据展示,不涉及先后排名 作为国内及业内领先的 AI 开发基础设施,本部分图表 中的开发框架、向量数据库、 开发平台、大模型均表现出 色,代表着它们的代码提交 频率、参与者、代码合并比 率等协作开发工作保持着较 高的水平。 17 / 111 OSS Compass Insight 本部分图表仅用于数据展示,不涉及先后排名 稳健性-活跃度 作为 AI 开发生态中的关键组 例外是 图片、视频等基于扩散模型的生成模型,在创作需求简单的情况下,未必需要通用语言模型这么 大,是一个差异化竞争的机会。 随着专业模型编程能力的提升和 AI Agent 工作流进一步成熟,低代码编程将成为可能,很 36 / 111 多人心中的想法将可以快速转化成应用,应用创业的试错成本已经大幅降低,未来甚至可能出现 Sam Altman 所说的“仅有一个人的 10 亿美金公司”。0 码力 | 111 页 | 11.44 MB | 8 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单清华大学新闻学院与人工智能学 院双聘教授 沈阳团队博士后 何静 能做什么? 要怎么做? 效果如何? 一 能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 通过数据清洗、数据集成、数据变换、特征工程等方式,实 现数据纠错、数据整合、格式转换、特征提取等。 通用性强:适用于多种自 然语言处理任务,如对话 生成和文本理解。 爬虫数据采集 1、阅读网页源代码,提取特定网页内容; 2、撰写python脚本; 3、提取并合并网址; 4、提取网址内容; 5、写入文件。 任务 你需要完成以下两个任务: 1.阅读网页【网址】源代码【对应网页源代码】。提取所 有包含“春运2025丨X月X日,全社会跨区域人员流动量完 成X万人次”的网址进行去重、筛选,合并成网址列表 响应速度快,能够高效提 取所有需求链接,输出完 整可运行python脚本,代 码运行后生成文件,但数 据采集结果为空。 DeepSeek R1 能够提取所有网址并进行 筛选、去重,所撰写代码 运行后完成数据爬虫任务, 所获取数据准确,少量数 据有所遗漏。 提示词 测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响,仅供参考,无法作为决策制定、质量评估或产品验证的最终依据。0 码力 | 85 页 | 8.31 MB | 8 月前3
人工智能安全治理框架 1.0导致工作秘密、商业秘密、敏感业务数据泄露。 (d)滥用于网络攻击的风险。人工智能可被用于实施自动化网络攻击或- 6 - 人工智能安全治理框架 提高攻击效率,包括挖掘利用漏洞、破解密码、生成恶意代码、发送钓鱼邮件、 网络扫描、社会工程学攻击等,降低网络攻击门槛,增大安全防护难度。 (e)模型复用的缺陷传导风险。依托基础模型进行二次开发或微调,是 常见的人工智能应用模式,如果基础模型存在安全缺陷,将导致风险传导至下 设计、研发、应用的价值观、伦理观对齐。探索适应人工智能时代的版权保护 和开发利用制度,持续推进高质量基础语料库和数据集建设,为人工智能安全 发展提供优质营养供给。制定人工智能伦理审查准则、规范和指南,完善伦理 审查制度。 5.5 强化人工智能供应链安全保障。推动共享人工智能知识成果,开 源人工智能技术,共同研发人工智能芯片、框架、软件,引导产业界建立开放 生态,增强供应链来源多样性,保障人工智能供应链安全性稳定性。 模型算法研发者安全开发指引 (a)研发者应在需求分析、项目立项、模型设计开发、训练数据选用等 关键环节,切实践行“以人为本、智能向善”理念宗旨,遵循科技伦理规范,采 取开展内部研讨、组织专家评议、科技伦理审查、听取公众意见、与潜在目标 用户沟通交流、加强员工安全教育培训等措施。- 13 - 人工智能安全治理框架 (b)研发者应重视数据安全和个人信息保护,尊重知识产权和版权,确 保数据来源清晰、途0 码力 | 20 页 | 3.79 MB | 1 月前3
DeepSeek从入门到精通(20250204)商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 剧本或对话设计 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据 需 求 生 成 代 码片段(Python、 JavaScript) • 自 动 补 全 调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像 推理模型那样复杂的推理和决策能力。 维度 推理模型 通用模型 优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 剧本或对话设计 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据 需 求 生 成 代 码片段(Python、 JavaScript) • 自 动 补 全 调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像 推理模型那样复杂的推理和决策能力。 维度 推理模型 通用模型 优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断0 码力 | 103 页 | 5.40 MB | 8 月前3
TiDB v8.4 中文手册Operator 可在公有云、私有云、混合云中实现部署工具化、自 动化。 • 兼容 MySQL 协议和 MySQL 生态 兼容 MySQL 协议、MySQL 常用的功能、MySQL 生态,应用无需或者修改少量代码即可从 MySQL 迁移到 TiDB。提供丰富的数据迁移工具帮助应用便捷完成数据迁移。 2.1.2 四大核心应用场景 • 金融行业场景 金融行业对数据一致性及高可靠、系统高可用、可扩展性、容灾要求较高。传统的解决方案的资源利用 语句收集这张表的统计信息时可能报错 Unknown column 'column_name' in 'expression' 的问题 #55438 @hawkingrei – 废弃统计信息相关的无用配置,减少冗余代码 #55043 @Rustin170506 – 修复执行一条包含关联子查询和 CTE 的查询时,TiDB 可能卡住或返回错误结果的问题 #55551 @guo-shaoge – 修复禁用 lite-init-stats 组件的版本为 v6.2.0 及以上,则 TiKV 组件版本不得低于 v6.2.0。 2.6 TiDB 社区荣誉列表 每一位贡献者都是推动 TiDB 健壮发展的重要成员,我们感谢所有为 TiDB 提交代码、撰写或翻译文档的贡献者。 2.6.1 TiDB 开发者 TiDB 开发者为 TiDB 的新功能开发、性能优化、稳定性保障做出了贡献。以下链接包含了 TiDB 相关 repo 的贡献 者名单:0 码力 | 5072 页 | 104.05 MB | 10 月前3
TiDB v8.5 中文手册Operator 可在公有云、私有云、混合云中实现部署工具化、自 动化。 • 兼容 MySQL 协议和 MySQL 生态 兼容 MySQL 协议、MySQL 常用的功能、MySQL 生态,应用无需或者修改少量代码即可从 MySQL 迁移到 TiDB。提供丰富的数据迁移工具帮助应用便捷完成数据迁移。 2.1.2 四大核心应用场景 • 金融行业场景 金融行业对数据一致性及高可靠、系统高可用、可扩展性、容灾要求较高。传统的解决方案的资源利用 语句收集这张表的统计信息时可能报错 Unknown column 'column_name' in 'expression' 的问题 #55438 @hawkingrei – 废弃统计信息相关的无用配置,减少冗余代码 #55043 @Rustin170506 – 修复执行一条包含关联子查询和 CTE 的查询时,TiDB 可能卡住或返回错误结果的问题 #55551 @guo-shaoge – 修复禁用 lite-init-stats 组件的版本为 v6.2.0 及以上,则 TiKV 组件版本不得低于 v6.2.0。 2.6 TiDB 社区荣誉列表 每一位贡献者都是推动 TiDB 健壮发展的重要成员,我们感谢所有为 TiDB 提交代码、撰写或翻译文档的贡献者。 2.6.1 TiDB 开发者 TiDB 开发者为 TiDB 的新功能开发、性能优化、稳定性保障做出了贡献。以下链接包含了 TiDB 相关 repo 的贡献 者名单:0 码力 | 5095 页 | 104.54 MB | 10 月前3
TiDB v8.2 中文手册Operator 可在公有云、私有云、混合云中实现部署工具化、自 动化。 • 兼容 MySQL 协议和 MySQL 生态 兼容 MySQL 协议、MySQL 常用的功能、MySQL 生态,应用无需或者修改少量代码即可从 MySQL 迁移到 TiDB。提供丰富的数据迁移工具帮助应用便捷完成数据迁移。 2.1.2 四大核心应用场景 • 金融行业场景 金融行业对数据一致性及高可靠、系统高可用、可扩展性、容灾要求较高。传统的解决方案的资源利用 组件的版本为 v6.2.0 及以上,则 TiKV 组件版本不得低于 v6.2.0。 2.6 TiDB 社区荣誉列表 每一位贡献者都是推动 TiDB 健壮发展的重要成员,我们感谢所有为 TiDB 提交代码、撰写或翻译文档的贡献者。 2.6.1 TiDB 开发者 TiDB 开发者为 TiDB 的新功能开发、性能优化、稳定性保障做出了贡献。以下链接包含了 TiDB 相关 repo 的贡献 者名单: JDBC 的实现。 本文档将展示如何使用 TiDB 和 JDBC 来完成以下任务: • 配置你的环境。 • 使用 JDBC 连接到 TiDB 集群。 • 构建并运行你的应用程序。你也可以参考示例代码片段,完成基本的 CRUD 操作。 88 注意 本文档适用于 TiDB Serverless、TiDB Dedicated 和本地部署的 TiDB。 4.3.1.1.1 前置需求 • 推荐0 码力 | 4987 页 | 102.91 MB | 10 月前3
Python 标准库参考指南 3.7.13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1478 27.7 2to3 - 自动将 Python 2 代码转为 Python 3 代码 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1498 27.8 test --- Python 回归测试包 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1532 28.5 timeit --- 测量小代码片段的执行时间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1540 28.6 trace --- 跟踪 Python . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1657 31.2 codeop --- 编译 Python 代码 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1659 32 导入模块 1661 320 码力 | 1961 页 | 9.14 MB | 9 月前3
Python 标准库参考指南 3.7.13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1391 27.7 2to3 - 自动将 Python 2 代码转为 Python 3 代码 . . . . . . . . . . . . . . . . . . . . . . . . . . 1410 27.8 test --- Python 回归测试包 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1443 28.5 timeit --- 测量小代码片段的执行时间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1451 28.6 trace --- 跟踪 Python 语句执行 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1559 31.2 codeop --- 编译 Python 代码 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1561 32 导入模块 1563 32.1 zipimport0 码力 | 1846 页 | 9.09 MB | 9 月前3
共 157 条
- 1
- 2
- 3
- 4
- 5
- 6
- 16













