2024 中国开源开发者报告中国开源开发者报告重点聚焦大模型,本章节以大模 型 LLM 开发技术栈作为切入点,将深入探讨以下中国 AI 大模型领域的代表性开源项目社区。 这些开源项目社区覆盖了深度学习框架、向量数据库、AI辅 助编程、LLM 应用开发框架、模型微调、推理优化、LLM Agent,以及检索增强生成(RAG)等多个关键技术栈。 为了更全面客观地展示中国大模型 LLM 开发技术栈的开源 社区生态,我们使用了 对开源社区的生态评 开发基础设施,本部分图表 中的开发框架、向量数据库、 开发平台、大模型均表现出 色,代表着它们的代码提交 频率、参与者、代码合并比 率等协作开发工作保持着较 高的水平。 17 / 111 OSS Compass Insight 本部分图表仅用于数据展示,不涉及先后排名 稳健性-活跃度 作为 AI 开发生态中的关键组 成部分,本部分图表中的开发 框架、大模型及相关工具在活 跃度的表现各有千秋。 2.0(专家建议稿)》对于免费且已开源方式提供人工智能研发的个人和 组织给予减轻或免承担法律责任;《生成式人工智能服务管理暂行办法》 则明确了人工智能技 术的使用和合规要求,促进了开源模型在合规框架下良性发展。 变革 端上模型的兴起与隐私保护 随着小型模型的性能逐步增强,更多高级 AI 正转向在个人设备上运行。这一趋势不仅显著 降低了云端推理成本,还提升了用户隐私控制。 中国 AI 社区在这一领域也做了重要贡献,推出了如0 码力 | 111 页 | 11.44 MB | 8 月前3
网易数帆 领先的数字化转型技术与服务提供商 2021国家级博士后科研工作站 云计算技术认证资质 信通院可信云服务网格先进级(最高级别)评估 信通院数字化可信服务能力认证(轻舟低代码平台) 可信云微服务评估先进级认证 Kubernetes 一致性认证 华为鲲鹏计算兼容性测试认证 大数据技术机构资质 信通院大数据技术标准推进委员会成员 大数据系统软件浙江省工程实验室 浙江省网易大数据重点企业研究院 浙江省云计算和大数据省级企业研究院 人工智能技术机构资质 浙江省增强现实与智能交互工程技术研究中心 CSA STAR Certification 2013 服务管理认证 CMMI (三级) 认证 大数据技术认证资质 信通院第十二批“大数据产品能力评测”(有数BI) 工信部一所信创适配测试认证 华为鲲鹏技术兼容性测试认证 QUALIFICATION 数帆资质(部分) 06 及以前 《Gartner 2020 中国 ICT 技术成熟度曲线》数据中台领域标杆厂商 信通院“大数据'星河'案例-行业大数据应用优秀案例” 监控分析 应用 Spring Clould Dubbo Service Mesh 分布式事务 GTXS TCC 事务消息 事务轨迹 认证鉴权 发布管理 流量控制 协议转换 微服务框架 NSF 注册发现 服务治理 服务路由 流量染色 服务化 将企业能力转化为数字化的 服务,打破企业软件应用中数 据孤岛等现状。 敏捷 通过小步快跑的方式敏捷迭 代,不断适应市场与业务需求 的变化,摆脱缓慢的大版本更0 码力 | 43 页 | 884.64 KB | 1 年前3
2023 中国开源开发者报告快速迭代发展,诸如 Dify.AI 的 LLMOps、Milvus 的向量 数据库、CodeGeeX 与 Comate 的 AI 编程、对 LLM Prompt 的研究、OneFlow 的深度学习框架。 值得一提的还有华为的盘古大模型,其中盘古气象大模型是 首个精度超过传统数值预报方法的 AI 模型,速度相比传统 数值预报提速 10000 倍以上,能够提供全球气象秒级预 报。盘古大模型的研究成果在国际顶级学术期刊《自然》正 刊发表,获得国际学术界的认可。 年底,零一万物推出的 Yi 模型,200K 上下文窗口,可处 理约 40 万字的文本,成为当时全球大模型中最长的上下文 窗口。其中 Yi-34B 在 Hugging Face 英文测试榜单中位 列第一,在 C-Eval 中文能力排行榜中超越所有开源模型。 十一、 这一小节,通过一些数据来简要概述 2023 年的 LLM、 GenAI。根据金融数据和软件公司 PitchBook 采用者仍处于早期阶段:26% 的人使用 AI 不到一年,而 18% 的人已经在生产中进行了应用。 16% 从事 AI 工作的受访者表示正在使用开源模型。 意外结果、安全性、公平性、偏见和隐私是采用者测试 的最大风险。 工业和信息化部赛迪研究院数据显示,目前,我国已有超 过 19 个大语言模型研发厂商。其中,15 家厂商的模型 产品已经通过备案,预计今年我国大语言模型市场规模将 达到 1320 码力 | 87 页 | 31.99 MB | 1 年前3
Moonshot AI 介绍Google、MIT、Amazon等团队的使⽤和扩展,并获得过OpenAIRL联创及负责⼈John Schulman亲⾃邀请加盟。 iv. 基础设施⽅⾯。团队核⼼成员曾带领数⼗⼈从零开发世界领先的深度学习框架,也具备数千 卡集群全⾃动化硬件运维告警、数百亿特征检索、⼤规模(数⼗PB数据、百万台机器)分 布式系统数量级性能优化的经验。 c. ⽬前团队⼈数超过80⼈,每个⽉都有在全球某个领域有显著影响⼒的⼈加⼊。 产品是通过了解⽤⼾的需求设计功能,新时代需要在制造的过程中完成设计。ChatGPT就是通过制造 完成设计,并没有先设计出来⼀堆场景再找对应的算法。Kimi的⽤⼾⾃⼰去上传简历然后做筛选,也 是我们上线之前完全没有测试过的⽤例。 资源获取肯定也很重要。其中主要烧钱的是算⼒。早期靠融资,到后⾯就需要更多的产品商业化。商 业化也不能照搬上⼀个时代成熟的东西创新,所以好的CEO和团队应该有⼀定经验,但同时也有很强 这是⼀个⾮常经典的关于⻓⽂本能⼒的测试:⼤海捞针。 什么意思呢?我会给模型⾮常多的⽂档,我会在随机在⽂档⾥⾯去插⼊⼀句话。⽐如说北京最好的事 情是什么,北京最吸引⼈的点是什么?你在⽂档⾥⾯去插⼊这句话,然后他你这样你就可以得到⼀个 实验,就是说你在不同的⻓度,在你不同的插⼊位置的情况,他的回答的准确率到底是什么样。 左边是GPT4的结果,这是在Twitter上⾮常⽕的⼀个测试。简单的说,就是你这个图⾥⾯红点越少越0 码力 | 74 页 | 1.64 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书www.iresearch.com.cn 基础软件开源界限划分 操作系统、数据库、中间件、AI框架底层代码按规范进行共享与协作 本篇报告研究的基础软件开源范围,是指研究“开源”中“基础软件”板块的情况。开源过程中,参与者可以共享、协作完成开发, 正好与基础软件庞大的开发量需求相契合。这种契合性 对于这四类基础软件(操作系统、数据库、AI框架、中间件),其编写者将实现功能的代码按照一定的开源规范 开放,任何人可以查看、使用、贡献,同时,使用者也要遵循一定的开源规范。 基础软件开源范畴界定 国内基础软件开源界定 基础软件 具备能衍生出并支撑 多个技术簇的一类根 技术软件,拥有技术 门槛高、衍生场景复 杂等特点 中间件:不同系统和应用程序之间交互 与协作的桥梁 AI框架:具备构建和部署人工智能模型 www.iresearch.com.cn 中国基础软件开源产业主要参与者图谱 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 中间件 操作系统 AI框架 数据库 开源技术论坛 开源产业联盟 开源组织 基础软件开源项目 开源基金会 开源社区评估机构 X-Deep Learning 开源代码托管平台 11 ©2023.11 iResearch0 码力 | 43 页 | 4.69 MB | 1 年前3
中国开源软件产业研究报告估算开源为企业项目节省38%的直接开发成本,其他成本和 收益也应纳入考量 经统计,企业进行软件开发的成本拆解到需求、设计、构建、测试、实施等五个环节后分别占比13%、13%、41%、23% 和10%。其中,开源能够在需求收集整理、软件构建和实施三个环节节省较高比例的成本,在软件设计、测试量个环节也 有一定降本效果,经估算,开源能够为项目节省38%的直接开发成本。对于企业而言,还应该纳入开源的成本&收益考量 的因素包括:软件开源后为企业带来的引流价值和市场宣传等价值、项目直接商业化销售和开源形成的收入差、企业建设 开源团队和办公室的管理支出。 项目开源节省的企业软件开发直接成本估算 需求 13% 设计 13% 构建 41% 测试 23% 实施 10% A:80% A:20% A:30% A:10% A:100% 需 设 构 测 实 • 需求收集、整理是开源社区的最大功能之一,市场上的开发者和用户在 Reliability 3.8% 开源最佳实践 3.8% 其他 11.5% 库 22.9% 大数据 11.1% 网络服务器 8.9% 可扩展标记语言 6.8% 数据库 5.7% web框架 5.4% 网络客户端 5.4% 内容 4.6% 构造管理 4.6% 云 3.5% 其他 21.1% 全球开源项目分布 总量持续上升,项目类型反映市场需求与热度 全球对开源的热0 码力 | 68 页 | 3.63 MB | 1 年前3
2021 中国开源年度报告……………… 20 3.8 Java 开发框架 ……………………………………………………………………………………… 21 3.9 PHP 开发框架 ……………………………………………………………………………………… 21 3.10 Ruby 开发框架 …………………………………………………………………………………… 22 3.11 Go 开发框架 ……………………………………………………………………………………… ……………………………… 22 3.12 Node.js 开发框架 ………………………………………………………………………………… 23 3.13 Python 开发框架 ………………………………………………………………………………… 23 3.14 前端开发框架 …………………………………………………………………………………… 24 3.15 数据库……………………………………………………………………………………………… …………………………………………… 25 3.16 版本控制工具 …………………………………………………………………………………… 26 3.17 AI 开发框架 ……………………………………………………………………………………… 26 3.18 云原生组件 / 工具 ………………………………………………………………………………… 27 4 开源社区参与现状 …………………………………………………………………………0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告并驾齐驱,某种程度反映了当下的技术热点趋势。开源的大数据 项目,Java (以及基于 JVM 的 Scala)是绝对主力,比如大家耳熟能详的 Hadoop, HBase, Spark 等,而开源的 AI 框架类项目,如:TensorFlow, PyTorch, MindSpore 等,则主要 由 Python 语言所构成。未来,这两大语言还将持续在各自擅长的领域发光发热。 Du Junping: Python Python's advantages over Java should continue to expand. 3.8 Java 开发框架 / 3.8 Java Development Framework Java 开发框架的使用中,Spring 以绝对优势遥遥领先。 Spring is far and away from the leader in using Java time being 3.9 PHP 开发框架 / 3.9 PHP Development Framework PHP 开发框架以 Thinkphp 的使用居多。 PHP development frameworks are predominantly used with Thinkphp. 3.10 Ruby 开发框架 / 3.10 Ruby Development Framework0 码力 | 199 页 | 9.63 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)API核心一致性测试, 使用Gateway API作为其唯一的配置语言来管理 Envoy代理,支持GatewayClass、Gateway、 HTTPRoute和TLSRoute资源。 近日,Envoy Gateway v0.4发布,版本特性更新 如下: • 升级网关API依赖,升级至Gateway API v0.6.2; • 支持通过Helm完成Envoy Gateway安装; • 添加构建初始框架用于扩展Envoy 计算基金会(CNCF)。 近日,Flagger v1.31.0发布,版本特性更新 如下: • 支持服务网格Linkerd 2.12及更高版本; • 修复Flux文档中有关安装loadtester的错误; • 删除OSM测试。 D2iQ Kubernetes Platform v2.5 发布 D2iQ Kubernetes Platform(DKP)是适应生 产环境的企业级自主可控Kubernetes平台。 DKP 度将 发布第三阶段的更新,该更新将默认启用修复 程序,届时将导致旧的Windows启动媒介将会 无法使用。 AI Village创始人Sven Cattell表示,“只有让更 多的人了解如何开展红队测试和评估人工智能模 型,才能解决这些模型中的各种问题。”通过对 人工智能模型组开展最大规模的红队演习,AI Village和DEF CON希望能培养出处理人工智能 系统漏洞的研究者社区。事实证明,大语言模型0 码力 | 22 页 | 1.99 MB | 1 年前3
2020 中国开源年度报告
前 端、AI 以及⼤数据分析⽅向,占⽐分别为10%、9%、9%,⾮技术⼈员以及其他⾏业的 从业者占⽐均为 7%,说明开源已经越来越受到社会各界的关注; 参与开源的形式由 2019 年以代码和测试为主转变为以代码和⽂档为主,社区和项⽬正在 意识到⽂档的重要性,更多开源贡献者投⼊到了⽂档撰写中; 开源活动的参与频率相较往年有所上升,这与国内愈发繁荣的开源氛围和逐渐丰富的开源 活动也有关系。81% 以巨⼤优势,成为参与者最喜爱的开源产品,MySQL 紧随其后,Apache 和容器界的⿊ ⻢ Docker 分别位列第三、第四。 5.3 具体参与的社区⼯作 绝⼤多数参与者在社区都参与代码或⽂档撰写的⼯作,测试、本地化以及活动组织也是很多⼈ 在社区会参与的⼯作。 5.4 最看好的开源产品 开源产品的前景展望中,互联⽹产品以 34% 的⽐例成为参与者最看好的开源产品发展⽅向。 ⼈⼯智能和开发⼯具异军突起,成为现在开源产品中的⻛⼝和热点。 年的约 1,19 万 增加了约 21.2%。 1.2 指标解释 2、主要内容与发现 2.1 世界开源 Top10 项⽬ 活跃度最⾼的项⽬是来⾃⾕歌的前端跨平台开发框架 flutter/flutter,此外,源于⾕歌的深度 学习框架 tensorflow/tensorflow,容器编排系统 kubernetes/kubernetes 也分别位于第 5 名和第 6 名,这说明了⾕歌在开源上的努⼒和影响⼒获得了业内的认可。0 码力 | 46 页 | 4.09 MB | 1 年前3
共 11 条
- 1
- 2













