2023年中国基础软件开源产业研究白皮书数据库开发者开源贡献特征 数据库指标提升 响应时间 并发能力 吞吐量 … 性能 数据备份 数据恢复 故障切换 … 可靠性 编程语言 系统接口 … 兼容性 存储 引擎 数据库内核 修改计算引擎支 持语法扩充 修改存储协议支 持更多数据库格 式 底层IO调优支持 高并发能力 … 围绕内核层级的 开发贡献 围绕数据库内核开发在国外 开发者中较为常见,国内开 对数据库外层能力的优化给 予贡献。同时,由于国内数 据库大多基于国外数据库内 核,开发者生态随开源项目 分布较为分散 开发者生态分散 项目1 生态1 项目2 生态2 … … SQL 引擎 内存 引擎 26 ©2023.11 iResearch Inc. www.iresearch.com.cn openGauss 自主化根技术,夯实四高能力,内核与架构双引擎创新驱动 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 openGauss自主架构与版本发展路径 基础版本 2020.03 Release 1.0 单机极致性能 20200 码力 | 43 页 | 4.69 MB | 1 年前3
2020 中国开源年度报告
2020 年新增的 PR(pull request)数量 pull_review_comment 项⽬ 2020 年所有 PR 下的 Review 评论数 merge_pull 项⽬ 2020 年被合并的 PR 数量 pull_commits 项⽬通过 PR 合⼊的 commit 数量 pull_additions 项⽬通过 PR 合⼊增加的代码⾏数 pull_deletions 项⽬通过 PR 成功推进。所以,运营⼀个好的开 源社区,最重要的是以⼈为中⼼,与他们共同成⻓。 对于 TiDB 社区来说,过去的⼀年发展还算迅速,去年 TiDB 4.0 版本正式推出了 TiFlash 列 式引擎。在 Real-time HTAP 的道路上迈出了坚实的⼀步。从我们的数据上来看,接近 1/3 的 4.0 集群⽤上了 TiFlash。说明直接在 TP 的数据上作实时的数据洞察是普遍的需求。 已解决 Issue PR 总 数量 打开 PR 数 已合并 PR 数 已关闭 PR 数 总贡献 ⼈数 233818 453 132 321 713 46 458 209 1046 提交次 数 Issue 总数 量 未解决 Issue 已解决 Issue PR 总 数量 打开 PR 数 已合并 PR 数 已关闭 PR 数 总贡献 ⼈数 10495 480 码力 | 46 页 | 4.09 MB | 1 年前3
2023 中国开源开发者报告在此之后的几周里,这场本应是不幸的事件却成了 LLM 领域最有趣的创新 来源之一。自 LLaMA 被泄露后,基于它而构建的 LLM 代理的创新呈现出 爆炸式增长。 开源游戏引擎 Godot 成立开发基金 在 Unity 引擎宣布 runtime fee 收费模式后,开源游戏引擎 Godot 成立了开 发基金 (Godot Development Fund)——维持项目的独立性,以及可持续性。 开源 .NET 框架 Furion 全面的引擎重写, 历经 17 个 alpha 版本、17 个 beta 版和 6 个 RC 版,Godot 4.0 于 2023 年 3 月正式发布。比起常规更新,这更像是一次伟大的重建。 CeresDB 1.0 正式发布 CeresDB 是一个时序数据库,与经典时序数据库相比,CeresDB 的目标 是能够同时处理时序型和分析型两种模式的数据,并提供高效的读写。 开源 3D 游戏引擎 Godot 月发 布,可用于生产环境且向前兼容。1.0 的 CLI 工具不仅进入了稳定状态, 还新增了许多破坏兼容性的重要变化,使错误处理程序更加直观。 Meilisearch 是 Rust 实现的高性能开源搜索引擎,支持方便地集成到任何 网 站 或 应 用 程 序 , 支 持 自 托 管 (self-hosting) , 可 作 为 Algolia 和 Elasticsearch 的轻量替代方案。 硬核发版0 码力 | 87 页 | 31.99 MB | 1 年前3
2024 中国开源开发者报告本部分图表仅用于数据展示,不涉及先后排名 作为国内及业内领先的 AI 开发基础设施,本部分图表 中的开发框架、向量数据库、 开发平台、大模型均表现出 色,代表着它们的代码提交 频率、参与者、代码合并比 率等协作开发工作保持着较 高的水平。 17 / 111 OSS Compass Insight 本部分图表仅用于数据展示,不涉及先后排名 稳健性-活跃度 作为 AI 开发生态中的关键组 无法持续更新的知识库,可以通过 RAG(Retrieval Augmented Generation,检索增强 生成)来解决。 RAG 的出现,让各界越来越深刻地认识到,大模型没必要存储那么多知识,只需要如何使 用搜索引擎这个外部工具即可。大模型可以在搜索结果上做进一步的信息筛选和优化,而搜索引 擎弥补了大模型的知识缺陷,实现了 1+1>=2 的效果。 RAG 可以被理解为智能体的最简单形式。未来的智能体可以实现多种工具的混合使用,甚 Haiku,大模型自身的能力不断提升,使得模型能够更好地理解和解 决复杂的编程问题。 智能体(AI agent)的引进:智能体可以收集和学习与任务相关的知识,可以直接调用静 态代码分析工具、直接调用搜索引擎和 API 为编程任务服务,并通过构建代码仓库知识图来帮 助大模型全面理解软件仓库的结构和依赖关系,从而更好地定位问题根源并生成有效的代码补丁。 智能体还可以动态获取代码片段和问题相关的信息,并分析和总结收集到的信息,以便规划0 码力 | 111 页 | 11.44 MB | 8 月前3
中国开源软件产业研究报告件的发行版,红帽提供二次开发、云计算、培训等服务形成收入,谷歌的Chrome浏览器本身不是开源软件,但谷歌开源 了这一浏览器的内核Chromium,基于这一内核二次开发的衍生浏览器均能够和谷歌的搜索引擎、邮件、地图等其他服务 形成良好的适配,谷歌公司的收入来源以广告为主,Chromium的开源帮助谷歌扩大了其产品生态的影响力,间接地帮助 谷歌确立了市场地位。红帽和谷歌的商业模式均能体现:开源软件本 状态,仅在运行过程中处于连接状态。LGPL协议规定,通过 动态连接引用开源代码形成的新程序可以闭源商用。 主程序代码 LGPL Library 静态链接:LGPL开源代码和其他部分代码处于“紧耦合”的 状态,可认为二者合并为了一个文件,在整个程序中密不可分。 54 开源软件概念铺陈 1 开源软件与云计算的关系 2 3 开源软件基金会前瞻 5 中国的开源软件法治建设状况 4 中国的开源软件产业发展洞察 55 沙箱阶段 Sandbox Stage ⚫ 至少有三个独立的用户在生产中成功使用了项目,经TOC的判断具备有 足够的质量和范围 ⚫ 拥有足够数量的提交者(项目贡献者) ⚫ 拥有大量的、持续的提交和合并的贡献 ⚫ TOC对上述要求有最终判决权 孵化阶段 Incubating Stage 毕业阶段Graduation Stage 63 ©2022.2 iResearch Inc0 码力 | 68 页 | 3.63 MB | 1 年前3
Gitea,新一代的代码托管平台CI / CD 包/发布管理 依赖项扫描 百科管理 项目管理 其他能力… 合并请求 代码审查 分支管理 代码仓库 Git代码托管 核心能力 新一代的代码托管平台 Gitea 的定位 遵循典型的 Git flow 工作流程 编写代码 01 创建仓库 管理员创建仓库,分支保护策略 、合并方式等,并进行初始化 02 clone 仓库 开发人员将仓库 clone 到本地开发机器 到本地开发机器 03 创建分支,代码编写, 提交代码至个人开发分支 04 创建合并请求 提交 pull request 到分支 05 . 审查与合并 Team Lead 对提交的 PR 进行代 码审查,通过后进行合并 06 发布 在分支上进行持续集成、测试验 证并最终通过 release 分支发布 为团队和开发人员提供从规划到生产的高效且易用的使用体验 Gitea 核心能力:代码仓库 核心能力:代码仓库 仓库管理 创建和管理仓库、浏览提交历史和代码文件、审查和合并代码提交、管理协作者、 管理分支等。支持标签、Cherry-pick、WebHook、集成协作工具等。 在线编辑 在线浏览和编辑源代码、配置文件、文档等,无需安装任何软件或插件。内 置文本搜索、代码高亮、自动补全、代码折叠等。 Gitea 核心能力:分支管理 分支保护 设置对分支的访问权限,并限制对该分支的操作。0 码力 | 30 页 | 14.34 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021数据模型驱动 可视化构建实体、数据结构、枚举等低 代码数据模型,自动生成数据库表和页 面交互。 支持企业集成 能够通过 API 集成企业内部的服务,实 现应用组装。 业务与流程融合 流程引擎基于 BPMN2.0 规范,可视化 流程开发,可支持如请假、入职、离职等 企业内常用流程场景。 支持软件资产多层次复用 应用、页面、基础组件、扩展组件、接口 等不同粒度软件资产,均支持复用。 零成本部署运维 以支撑业务系统等容器化部署运行。 应对复杂业务场景 简化复杂应用的部署流程,实现分布式应用的大规模快速部署,让应用 的管理与交付更加标准、敏捷、高效、可控。 方案架构 面向云原生架构的 双模引擎 拥抱开源生态 兼容国产无绑定 提供稳定可靠 治理能力 安全合规 业务 监控 异构系统 应 用 性 能 追 踪 A P M 统 一 日 志 中 心 DevOps 体系 基础设施 CI/ CD 金融服务 治理框架 业务后台 业务后台 分布式缓存 分布式数据库 对公业务群 客户 中心 产品 中心 营销 中心 支付 中心 风险 中心 运营 中心 ... 零售业务群 互联网业务群 查询引擎 消息队列 云原生 PaaS 中间件 业务前台 API网关 CI/ CD 分布式储存 ESB 体系 规范 方法 技术 工具 SOLUTIONS 融合网易互联网技术与金融行业服0 码力 | 43 页 | 884.64 KB | 1 年前3
Moonshot AI 介绍ramming实 现的,今天实际上是通过让模型的prefix变得⾮常复杂,从这个通⽤的集合中抽出你想要的东西。通 过这种⽅式实现个性化才是AI-native的个性化,外挂⼀个传统的推荐引擎肯定会被新⽅式淘汰。 海外独⻆兽:你们先做losslesslong-context这个决策是怎么做出来的? 杨植麟:我觉得最重要的还是以终为始地思考这个事。⼤模型作为新的计算机肯定也需要很⼤的内 海外独⻆兽:沿着⼊⼝逻辑的话,你觉得未来会有⼏个⼊⼝? 杨植麟:⾄少有两个,⼀个是有⽤的,⼀个是好玩的。 信息⼊⼝可能不存在了,因为我们搜寻信息本质上是希望端到端完成⼀个任务。智能的⼊⼝以后⼤概 率会覆盖搜索引擎这类信息⼊⼝。⼈获取信息并不是终极需求,它只是⼀直被强⾏定义成⼀种需求。 有些时候我们是希望完成⼀件事,有些时候是希望学习某个东西,AGI的⼊⼝应该直接帮⽤⼾完成任 务,⽽不是帮他们获取信息。 规模,然后才去不断拓展服务的边界,逐渐成为通⽤的应⽤。但是在新的技术范式下,如果要做⼀款 superapp,是因为先具备了通⽤的⽣产⼒引擎,然后⾃然⽽然变成了superapp。这是两个时代引擎 驱动的基因的不同,上⼀个时代⼤家是跑⻢圈地,赶紧把规模做起来。现在是因为有技术的引擎作为 驱动,天⽣就具有superapp的基因。 杨植麟:总结得特别好,补充⼀点就是,即使技术上很通⽤,肯定也是要从⼀部分的场景开始,然后0 码力 | 74 页 | 1.64 MB | 1 年前3
2021 中国开源年度报告资料来源:VansonBourne,云启资本 围绕这个问题以亚马逊网络服务 (AWS) 与 Elastic 的争论为例。Elasticsearch 是 Elastic 公司旗 下的一款搜索和数据分析引擎,采用 OpenCore 的商业模式。AWS 在它的下游开了一个发行版叫 OpenDistro for Elasticsearch。2021 年 1 月,Elastic 公司宣布即将变更 Elasticsearch 资料来源:公司公告,云启资本 104 Zilliz 的成功代表着基于 GPU 的大数据加速器为企业日益增长的数据分析需求提供了有效解决方案。 Zilliz 的核心项目向量相似度搜索引擎 Milvus 是全球首款 GPU 加速海量特征向量匹配和检索引擎。 Milvus 依托 GPU 加速,提供极速特征向量匹配以及多维度数据联合查询(特征、标签、图片、视 频、文本和语音等联合查询)功能,并且支持自动分库分表和多副本,能对接0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告VansonBourne, Yunqi Partners 围绕这个问题以亚马逊网络服务 (AWS) 与 Elastic 的争论为例。Elasticsearch 是 Elastic 公司旗下的一款搜索和数据分析引擎,采用 OpenCore 的商业模式。AWS 在它的 下游开了一个发行版叫 OpenDistro for Elasticsearch。2021 年 1 月,Elastic 公司宣布 即将变更 Elasticsearch Partners Zilliz 的成功代表着基于 GPU 的大数据加速器为企业日益增长的数据分析需求提供了有效解 决方案。Zilliz 的核心项目向量相似度搜索引擎 Milvus 是全球首款 GPU 加速海量特征向量 匹配和检索引擎。Milvus 依托 GPU 加速,提供极速特征向量匹配以及多维度数据联合查询(特 征、标签、图片、视频、文本和语音等联合查询)功能,并且支持自动分库分表和多副本,能对0 码力 | 199 页 | 9.63 MB | 1 年前3
共 11 条
- 1
- 2













