2024 中国开源开发者报告目 录 Part 2: TOP101-2024 大 模 型 观 点 编委会 21 | 2024 年中国开源模型:崛起与变革 26 | 开源模型未必更先进,但会更长久 30 | 大模型撞上“算力墙”,超级应用的探寻之路 36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 月 OSS Compass 平台相关公开数据 15 / 111 OSS Compass Insight 2024 中国开源开发者报告重点聚焦大模型,本章节以大模 型 LLM 开发技术栈作为切入点,将深入探讨以下中国 AI 大模型领域的代表性开源项目社区。 这些开源项目社区覆盖了深度学习框架、向量数据库、AI辅 助编程、LLM 应用开发框架、模型微调、推理优化、LLM Agent,以及检索增强生成(RAG)等多个关键技术栈。 co/spaces/ zh-ai-community/zh-model-rel ease-heatmap 21 / 111 其中,Qwen 系列凭借灵活的多尺寸选项,强大的多语言支持以及友好的模型授权功能, 赢得了社区开发者的高度评价。DeepSeek 通过引入多头潜在注意力(Multi-head Latent Attention, MLA)技术,在性能和成本上实现了革命性突破,开创高性价比的 AI0 码力 | 111 页 | 11.44 MB | 8 月前3
2023 中国开源开发者报告开源的 Llama 2 更成为了 LLM 领域开源势力的典型代表,它的 出现,犹如一颗投入平静湖面的石子,激荡起层层水波, “Llama 2 一开源,全球范围内进入了百模混战阶段”, 这个说法一点也不为过。 年底的“虚假宣传” Gemini 与“磁力链开源” Mistral 8x7B 两大神作,也凭借不输 GPT-4 的实力,将 LLM 狂 潮卷到天际。 四、 Stable Diffusion 1 1 (CoT)”、“自动推理并使用工具(ART)”、“思维 树(ToT)”……甚至运用心理学对 LLM 进行“情绪提 示(EmotionPrompt)”,提示词工程俨然在将 LLM 一 点一点解剖,试图让人类成为可以将其掌控的“咒术师”。 八、 AutoGPT 的出现,带着 LLM Agent 的概念进入 LLM 发展的新阶段。LLM Agent 是一种基于 LLM 的智能代 理 原生,目前还没有明确的定义,大致是说,不同于当前 各种应用在原本的基础上增加 AI 能力,使其智能化,但 它的智能只充当了“辅助”角色;在 AI 原生的语境下, LLM 从一开始就是应用的中枢,应用本身的架构、功能、 交互层是围绕 LLM 中枢来构建的。也许 ChatGPT 是最 经典的“AI 原生”应用。此概念目前还处在萌芽期,明确 的概念、应用场景、架构、技术栈细节等尚未完成自洽。 换一种视角来看,这个概念的提出其实都没技术什么事,0 码力 | 87 页 | 31.99 MB | 1 年前3
2021 中国开源年度报告开源软件商业化可以选择的路径和案例 ………………………………………………………… 84 3.2 开源项目的 life cycle 以及软件供应商在对应阶段的重点工作 ……………………………… 85 3.3 商业化过程中的风险点 …………………………………………………………………………… 87 4 投资——如何找到下一个开源独角兽 …………………………………………………… 93 4.1 成功商业开源项目判断标准 ………… 注:问卷篇中饼图的数据标签,例如“硕士 ,107,20%”,其中硕士表 示选项,107 是选择该选项的人数,20% 是选择该选项人数所占的比例。 专家点评 堵俊平:整体而言,在开源领域,男性在参与人数上仍然占据绝对优势,这一点和 IT 行业整体参与者性别比 例失调的趋势是一致的。尽管越来越多的开源项目都在争取吸引更多的女性开发者大力来参与开源,但整体 的状况从调查来看并没有太多改善。可能我们首先要做的是吸引女性在 IT 而言,有独创性的特色功能是 引发大众关注和使用的关键。 30 4.3 参与开源社区的工作 绝大多数受访者在社区都参与代码或文档撰写的工作,测试、本地化、 活动组织以及媒体宣传也是很多人在社区会参与的工作。 专家点评 堵俊平:“Community over Code”, 开源社区的工作不只是代码,代码以外的工作占的比例更高。另外, 开源项目非常注重文档建设,这一点从本调查也可以反映出来。0 码力 | 132 页 | 14.24 MB | 1 年前3
Moonshot AI 介绍detectron2,⼀个被⼴泛使⽤的视觉开源项⽬并被集成到Meta全线VR/AR产品中。 iii. 强化学习⽅⾯。团队成员作为⼀作提出了基于关系学习的少样本⽅法,得到斯坦福⼤学、 Google、MIT、Amazon等团队的使⽤和扩展,并获得过OpenAIRL联创及负责⼈John Schulman亲⾃邀请加盟。 iv. 基础设施⽅⾯。团队核⼼成员曾带领数⼗⼈从零开发世界领先的深度学习框架,也具备数千 卡集群全⾃动化硬 提醒:对了,我们产品名字已更新为“Kimi智能助⼿”,⼿机上的App和⼩程序都会更新为“Kimi智 能助⼿”,电脑上输⼊kimi.ai就能快速进⼊⽹⻚版。之前的名字KimiChat就不再使⽤了。 【功能亮点】 • 智能搜索:搜索实时信息,迅速整合,给出详尽回答,并提供搜集到的信息来源,让对话兼具丰富 性和准确性。 • ⾼效阅读:⻓⽂快速摘要,打破语⾔壁垒,帮你精准理解⽂献书籍、⻓篇报告、复杂合同、⽹⻚⻓ 档、多个⽂件,都可以快速摘要、翻译、答疑,⽀持上传PDF、Word、Excel、PPT、TXT⽂件和 图⽚。 • 整理资料:⽆论是堆积如⼭的发票,还是复杂冗⻓的会议记录,Kimi都能智能识别整理,⾃动提取 关键点,让资料整理不再繁琐,信息⼀⽬了然。 • 辅助创作:根据你提供的⽹⻚链接、⽂件、指令,Kimi可以帮助你梳理⼤纲、续写⽂章、创作⽂ 案、写作周报、撰写⽅案,成为你的内容创作⼿脚架,提供⽆限灵感。0 码力 | 74 页 | 1.64 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书注释:由于暂无国内厂商主导的开源编程语言,因而不列入本报告研究范围。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 对于这四类基础软件(操作系统、数据库、AI框架、中间件),其编写者将实现功能的代码按照一定的开源规范 开放,任何人可以查看、使用、贡献,同时,使用者也要遵循一定的开源规范。 基础软件开源范畴界定 国内基础软件开源界定 基础软件 具备能衍生出并支撑 多个技术簇的一类根 不同许可证对软件再发行是否需要开源有不同要求,企业需根据自身商业 需求谨慎选择开源代码使用 来源:参考可信开源合规计划,根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 使用开源许可证需注意的风险点 审判机关 开发者 开源许可证 “两者的契约” 开源者 将许可证视为“合同”,基于《著作权法》、 《专利法》等法律法规对相关纠纷进行判决 围绕许可证可能出现的其他风险 专利风险 数据风险 议,依据企业对项目的开源 方案审定协议中个别条款 向上对接高校及研究机构, 加紧基础技术共建;向下对 应发行版ISV厂商,将软件向 更多行业及场景渗透 规划开源软件迭代方向,包 括但不限于软件特性增加、 现有功能增强、Bug修补, 并提出相应的合格指标 一方面积极对社区开发者的回 复给予反馈,另一方面发掘优 秀的灵感,增强创新能力 对开发者提交的代码进行评 审,确保代码的可读性和可 维护性,及时做出缺陷反馈0 码力 | 43 页 | 4.69 MB | 1 年前3
2021 中国开源年度报告proportion of people who chose that option. 【专家点评】/ [Expert Comment] 堵俊平:整体而言,在开源领域,男性在参与人数上仍然占据绝对优势,这一点和 IT 行 业整体参与者性别比例失调的趋势是一致的。尽管越来越多的开源项目都在争取吸引更多 的女性开发者大力来参与开源,但整体的状况从调查来看并没有太多改善。可能我们首先 要做的是吸引女性在 IT 4.2 检索开源项目的原因 / 4.2 Reasons for retrieving open source projects 受访者们检索开源项目的原因多种多样,占比较大的原因是寻找特定功能的软件。 Respondents searched open source projects for various reasons, with the majority of the reasons from the perspective of solving their problems. 堵俊平:用户是大部分人接触开源的首要角色,也是最重要的角色。对开源项目而言,有 独创性的特色功能是引发大众关注和使用的关键。 Du Junping: Users are the first and most crucial role for most people to approach0 码力 | 199 页 | 9.63 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)Software Architecture(AGESA)固件的计划。新固件 将经历四个阶段的开发周期预计到2026年开始 投入使用。 OSM(Open Service Mesh)是一个轻量级、 可扩展的云原生服务网格项目,旨在为运行在 Kubernetes上的应用程序提供简单、完整且独 立的服务网格解决方案,包括处理在Kuberne- tes集群上运行的微服务的流量管理、策略执行 和可观测性等任务,以简化应用程序的部署和 近日,KSOC推出业内首个实时Kubernetes安 全态势管理平台。Kubernetes安全态势管理平 台可以通过实时上下文以及当前和历史信息准 确定位攻击活动,同时还可以根据集群的当前 状态提供可操作的补救措施。具体功能包括: • 实时态势管理,发现基于事件的错误配置; • 汇总并找到Kubernetes RBAC中的过度权限; • 防止部署不合规的工作负载,减少潜在爆炸 半径; • 扫描漏洞并为运行的容器生成SBOM。 不但可以实现AGESA的各种传统功能,还有轻量 化、简单、透明、安全、扩展灵活等优势。 全球开源态势洞察|第十期 02 01 行业发展 Nutanix推出Kubernetes 数据管理平台Nutanix Data Services for Kubernetes 近日,Nutanix推出Kubernetes数据管理平台 Nutanix Data Services for Kubernetes。具体 功能如下:0 码力 | 22 页 | 1.99 MB | 1 年前3
中国开源软件产业研究报告A:20% A:30% A:10% A:100% 需 设 构 测 实 • 需求收集、整理是开源社区的最大功能之一,市场上的开发者和用户在 接触项目的过程中自然会产生进一步产品需求,并反馈给社区 • 软件设计主要涉及项目整体架构规划,开源社区开发者主要贡献 为小范围的补丁和功能开发,对整体架构的关注度一般不高 • 软件构建主要指的是核心代码的编写流程,开源社区的贡献者 以编写代码的形式向项目提交创新和改良,能够帮助项目降低 DevOps, CI/CD & Site Reliability 3.8% 开源最佳实践 3.8% 其他 11.5% 库 22.9% 大数据 11.1% 网络服务器 8.9% 可扩展标记语言 6.8% 数据库 5.7% web框架 5.4% 网络客户端 5.4% 内容 4.6% 构造管理 4.6% 云 3.5% 其他 21.1% 全球开源项目分布 总量持续上升,项目类型反映市场需求与热度 核心关键,通过云平台托管和分发, 开源项目可以更快实现这一点 开源运营亟需足够的用户基数 对于运营开源项目的企业而言,虽然 云平台托管带来了一些利益冲突,但 这也同时增加了项目受到的关注度, 有利于公司实现市场渗透 开源企业通过引流实现增收 公有云厂商通常拥有众多的云产品,开源软件经平台托管 后,使用者同时也可能在使用其他云产品,并在这个过程 中发现开源项目的缺陷及创新点,从而促进开源运营 云产品交互系统促进开源创新0 码力 | 68 页 | 3.63 MB | 1 年前3
2020 中国开源年度报告
25% 的参与者表示会有此类担忧,开 源软件的安全问题仍然值得我们关注。 【专家点评】 红薯:开源软件由于其机制的关系,通过开源社区不断地发现问题并维护,其安全问题可能并 不是开发者们的主要关注点。其实除了技术⽅⾯的安全问题,开源合规性等许可证⽅⾯的安全 问题同样需要开发者们重视,许可证冲突问题所带来的法律⻛险影响⾮常⼤且很难被发现,尤 其是对于企业来说,检查所使⽤的开源软件合规性,其重要性不亚于其技术安全。 如此⾼的 活跃度,也可以看出其社区的活跃程度。 百度在⼈⼯智能领域的表现⾮常不错,其深度学习平台 PaddlePaddle 占据了 6 个项⽬,分 别是核⼼框架 Paddle 以及相关⼯具库、扩展版本和模型库 Models;此外开放⾃动驾驶平台 ApolloAuto/apollo 也榜上有名。 中国的 Top50 项⽬列表中,包括阿⾥的 Ant-Design 组件库,京东基于 React taro,由饿了么(已被阿⾥收购)前端团队开源的 Vue UI 组件库 Element 等等, 这说明在国内,前端群体在开源社区更为活跃;另外前端代码⼀般也不太涉密,因此公司在⼼ 态上更开放⼀些。不过这其中也有⼀点需要引起注意,上榜的前端项⽬组件库居多,但是缺少 核⼼项⽬。 属于⼈⼯智能领域的项⽬ PaddlePaddle/Paddle、apache/incubator-tvm、 Tencent/ncnn、alibaba/MNN0 码力 | 46 页 | 4.09 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021负责人 温先生 温氏集团 网易数帆轻舟团队协助我们构建了大华统一产品服务中心,大幅 提升了不同产品线的信息交互效率。轻舟云原生平台使我们统一 了企业信息化标准,降低了运维难度,并提升了平台的稳定性和可 扩展性,改善了用户体验。后续将继续基于轻舟进行共享能力中 心的沉淀,加速前端业务需求的响应速度,构建企业信息化服务 资产体系。 信息科技部 屠经理 大华股份 网易数帆与海亮的合作是基于海亮自身的业务需求出发的,在与 PRODUCT 低代码应用开发平台 LCAP 持续交付平台 CICD 流水线 容器部署 主机部署 策略部署 开放 治理 监控 事务 管理 DevOps 多云部署 服务治理 能力扩展 中间件高可用 全链路监控 容器平台NCS 轻舟混合云 多云管理 多集群管理 镜像仓库 容器管理 轻舟低代码 应用管理 可视化开发 WebIDE 一键发布 资产中心 轻舟中间件 中间件PaaS 精细化流量管控 支持不同维度的流量治理,并具备丰富 的流量管控能力。 架构平滑演进 支持单体架构向微服务架构、微服务架 构向服务网格架构平滑演进。 开放兼容 全面覆盖主流微服务开发技术选型,增 强、扩展开源服务网格。 异构应用统一治理 多框架、多协议、多语言服务的统一治 理,避免技术栈重复建设。 异构集成 支持异构协议转换为 HTTP 协议 RESTFUL 接口,具备请求转换能力,有 效集成企业存量应用。0 码力 | 43 页 | 884.64 KB | 1 年前3
共 13 条
- 1
- 2













