2023 中国开源开发者报告
大模型、上海人工智能实验室的书生通用大模型、腾 讯的混元大模型、蚂蚁的百灵大模型等。 另一方面,除了大模型本身,中国在 LLM 相关技术领域也 快速迭代发展,诸如 Dify.AI 的 LLMOps、Milvus 的向量 数据库、CodeGeeX 与 Comate 的 AI 编程、对 LLM Prompt 的研究、OneFlow 的深度学习框架。 值得一提的还有华为的盘古大模型,其中盘古气象大模型是 首个精度超过传统数值预报方法的 【生产事故】冥场面!速来围观 2023 十大生产事故“名 场面”。 1 1 目录 一、开源开发者事件回顾 三、中国开发者开源新动向 二、2023 LLM 技术报告 46 | 向量数据库 47 | 数据库向量支持 48 | 大模型框架、微调 51 | 大模型训练平台与工具 53 | 编程语言 57 | 知名大模型 58 | 备案上线的中国大模型 21 | 开源开发者事件回顾 JS 工具库 lodash 关闭所有 issue 和公开 PR MySQL 目前已经成为中国 用户使用最广泛的开源数据 库,其中 5.7 版本用户的比 重又是最高的。根据报告中 的统计数字,MySQL 5.7 用 户占比在国内高达 47%。届 时这些用户将会面临选择, 如何应对 EOL 事件。 MySQL 5.7 于 2023.10.21 正式 EOL 承载微软跨平台生态之梦的 UWP,正在消亡0 码力 | 87 页 | 31.99 MB | 1 年前3中国开源软件产业研究报告
商业化 渠道化 为互补产品宣传、导流 提升企业市场声量 产业级影响 促进协同产品出现和创新 构建开源产业基金会 e.g. Linux发行版 e.g. Google浏览器 e.g. 开源数据库托管 产 业 协 同 软件开源核心运营 e.g. Kubernetes 11 ©2022.2 iResearch Inc 开源是软件市场“后进者”扩大市场影响力的重要手段 从市场竞争战略的视角上看,软件开源通常是软件市场的“后进者”扩大市场影响力、追赶头部企业的重要手段。观察PC 操作系统、移动操作系统、DBMS(核心数据库)三大类典型基础软件产品的开源/闭源情况,整体来看后出现的软件产品 更有可能是开源的,这一情况在DBMS情况尤为显著。通过开源,新的产品能够能更快地打入市场,开放的源代码也更容 易获得顾客的信任和了 2008 Windows Phone 2010 全球移动操作系统开/闭源情况 Oracle 1979 DB2 1983 SQL Server 1989 Access 1992 MySQL 1995 PostgreSQL 1996 MongoDB 2009 SQLite 2000 全球DBMS操作系统开/闭源情况 BeOS Linux FreeBSD ReactOS0 码力 | 68 页 | 3.63 MB | 1 年前32021 中国开源年度报告
Python 开发框架 ………………………………………………………………………………… 23 3.14 前端开发框架 …………………………………………………………………………………… 24 3.15 数据库……………………………………………………………………………………………… 25 3.16 版本控制工具 …………………………………………………………………………………… 26 3.17 AI 开发框架 借鉴。 堵俊平:这两年,一个很明显的趋势是越来越多的初创企业参与开源。这一方面得益于 ToB 赛道成为市场和 政策导向的热点,另一方面开源所代表的开放式创新也被投资界所认可。尤其是开源与数据(数据库 & 大数据) 以及 AI 等热点技术相结合,更是为市场带来了极大的想象空间。 参与者所在企业类型 外企 国内初创公司 国内大型互联网企业 国企 / 央企 / 事业单位 其他 外企,25,10% 本容 量问题,还是因为国内开源项目对华人发起的 Vue 情有独钟。 2021 中国开源年度报告 25 3.15 数据库 数据库使用情况中,不出意外地,MySQL 以绝对优势遥遥领先,SQL Server 与 Oracle 跟随其后。 专家点评 段夕华:Mysql 和 Postgres 的对比关系也有国内外差异,估计还是惯性使然 26 3.16 版本控制工具 毫无疑问的是,Git0 码力 | 132 页 | 14.24 MB | 1 年前32021 中国开源年度报告
learning. 堵俊平:这两年,一个很明显的趋势是越来越多的初创企业参与开源。这一方面得益于 ToB 赛道成为市场和政策导向的热点,另一方面开源所代表的开放式创新也被投资界所认 可。尤其是开源与数据(数据库&大数据)以及 AI 等热点技术相结合,更是为市场带来 了极大的想象空间。 Du Junping: In the past two years, a clear trend has been that are still in use by many participants. 3.16 数据库 / 3.16 Database 数据库使用情况中,不出意外地,MySQL 以绝对优势遥遥领先,SQL Server 与 Oracle 跟 随其后。 Not surprisingly, MySQL leads the pack in terms of database usage, with Oracle trailing behind. 【专家点评】/ [Expert Comment] 段夕华:Mysql 和 Postgres 的对比关系也有国内外差异,估计还是惯性使然 Duan Xihua: The comparison between Mysql and Postgres is also different at home and abroad. It is probably0 码力 | 199 页 | 9.63 MB | 1 年前3JumpServer ⼴受欢迎的开源堡垒机
3 5 ⽬ 录 各种类型 的 IT 资产 为什么要使⽤堡垒机? - 以更安全、更⾼效的⽅式管控和登录各种类型的资产 - 系统管理员 普通⽤户 外包⼈员 临时访客 服务器 ⽹络设备 数据库 Kubernetes 事前授权 事中监察 事后审计 管理者期望 堡垒机的 4A 能⼒ 身份鉴别 Authentication 授权控制 Authorization 安全审计 Auditing CORE MySQL / Redis 等 本地存储 云存储 负载 接⼊ 核⼼ 数据 存储 KoKo Lion Razor Magnus Kael Tinker Panda KoKo Linux、命令⾏数据库等连接管理; Lion 浏览器图形化连接管理 Windows 资产; Razor 传统客户端连接管理 Windows 资产; Chen 浏览器图形化连接管理数据库; Magnus Magnus 传统客户端连接管理数据库资产; Kael 连接管理 GPT 资产; Tinker 基于 Windows 操作系统的应⽤发布连接管理; Panda 基于国产操作系统的应⽤发布连接管理。 千锤百炼,累计安装已超过 300,000 次 注:以上为 JumpServer 堡垒机企业版部分⽤户。 强⼤的市场影响⼒:堡垒机 = JumpServer JumpServer 堡垒机的特⾊功能0 码力 | 40 页 | 6.66 MB | 1 年前3全球开源发展态势洞察(2023年第八期)
openatom.org/legal-IP 撰稿:刘博雅;审校:王荷舒 PingCAP 平凯星辰 主要创始团队 PingCAP平凯星辰成立于2015年,是一家企 业级开源分布式数据库厂商,提供包括开源分 布式数据库产品、解决方案与咨询、技术支持 与培训认证服务,致力于为全球行业用户提供 稳定高效、安全可靠、开放兼容的新型数据服 务平台,解放企业生产力,加速企业数字化转 型升级。在帮助企业释放增长空间的同时,也 作者,曾任职豌豆荚/京东,擅长分 布式数据库和分布式缓存。 黄东旭 联合创始人 兼CTO 开源分布式缓存服务Codis 的作者,资深infrastructure 工程师,开源狂热分子。 崔秋 联合创始人 开源爱好者。 开源项目梳理 项目名称 项目开源 时间 技术领域 项目归属 托管平台 GitHub 信息 开源 许可证 2015年开源 分布式HTAP 数据库 公司项目 Apache GitHub GitHub Apache 2.0 Apache 2.0 Apache 2.0 / 公司项目 CNCF CNCF 公司项目 分布式HTAP 数据库 云原生 混沌工程平台 开源软件洞察工具 分布式Key-Value 数据库 2022年开源 2019年开源 2018年开源 / TiDB TiFlash Chaos Mesh ossinsight TiKV Star:13K; Fork:2K;0 码力 | 22 页 | 1.99 MB | 1 年前32020 中国开源年度报告
作为当时开源项⽬的主战场,Linux 操作系统、 桌⾯办公软件(GNOME, OpenOffice)和浏览器(Mozilla)掀起了第⼀波开源的浪 潮;近年来随着互联⽹的兴起,开源的项⽬和技术越来越百花⻬放,从数据库到中间 件,从前端到后端,从编程语⾔到编译器,从物联⽹到微服务,从⼤数据到⼈⼯智能, 开源的技术和项⽬越来越丰富和多样化。 4、开源⼯作现状 4.1 接触开源的时间 有近三成参与者接触开源的时间在 品和操作系统相关产品仍然是⼤家了解 和接触开源的最初窗⼝。 4.7 最希望能够开源的产品 相⽐于 2019 年,开发⼯具在今年成为⼤家最希望能够开源的产品类型第⼀名,紧接着的是操 作系统,数据库产品与中间件产品也是很多⼈希望能够开源的产品类型。 4.8 企业对开源的贡献 在参与者眼中,GitHub 对于开源软件的贡献最⼤,其次是 Google,⽽在国内企业中, Alibaba、Huawei 开放透明的代码和知识共享,以及开源的精神理念成为开源最吸引参与者的因素,⽽软件的购 买成本却并不是主要的因素。 5.2 最喜欢的开源产品是什么 Linux 以巨⼤优势,成为参与者最喜爱的开源产品,MySQL 紧随其后,Apache 和容器界的⿊ ⻢ Docker 分别位列第三、第四。 5.3 具体参与的社区⼯作 绝⼤多数参与者在社区都参与代码或⽂档撰写的⼯作,测试、本地化以及活动组织也是很多⼈0 码力 | 46 页 | 4.09 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
云计算开源产业联盟云原生十大优秀案例 infoQ 中国技术力量年度榜单 InfoQ2020 最有价值技术团队 InfoQ2020 最佳技术社区驱动力奖 思否 SegmentFault 中国技术品牌影响力企业 DTCC 第十一届中国数据库技术大会创新产品奖 《Gartner 2021 中国 ICT 技术成熟度曲线》数据中台领域标杆厂商 信通院可信云计算最佳实践服务网格 2021 数博会“十佳大数据案例” 《Gartner 2019中国 全链路监控 容器平台NCS 轻舟混合云 多云管理 多集群管理 镜像仓库 容器管理 轻舟低代码 应用管理 可视化开发 WebIDE 一键发布 资产中心 轻舟中间件 中间件PaaS RDS MySQL Redis Kafka RocketMQ RabbitMQ Elastiscearch API网关 API Gateway 轻舟微服务 全链路应用监控 APM 服务拓扑 链路追踪 基于通用语言封装的可视化开发语言,具 备完善的静态类型系统和组件扩展机 制,适合 80% 企业级应用开发,灵活性 高,可靠性强。 数据模型驱动 可视化构建实体、数据结构、枚举等低 代码数据模型,自动生成数据库表和页 面交互。 支持企业集成 能够通过 API 集成企业内部的服务,实 现应用组装。 业务与流程融合 流程引擎基于 BPMN2.0 规范,可视化 流程开发,可支持如请假、入职、离职等 企业内常用流程场景。0 码力 | 43 页 | 884.64 KB | 1 年前3Gitea,新一代的代码托管平台
企业版介绍 3 Gitea 优势总结 2 极佳体验 接近 GitHub 使用体验 + 兼容 GitHub API、Actions、操作语法生态 + 本地化部署 简单易用 多种操作系统和数据库部署方式 简单的使用方式,多种的集成方式 卓越性能 采用 Go 语言编写,资源占用仅 为 GitLab 的 1/4,运行速度约为 GitLab 的 3 倍 高可配置 100+ 配置项,40+ 支持多种部署方式,几条命令快速安装和升级 Gitea; • 兼容多种架构(x86、arm64)和操作系统(Linux、Windows、macOS、 FreeBSD等) • 与多种数据库无缝集成,包括 SQLite、MySQL、PostgreSQL、TiDB、MS SQL 等。 部署简单 • 拥有出色的第三方集成社区,全面覆盖控制面板、迁移、插件、脚本、工作流、 主题等各方面内容; • D Drone、Jenkins、VSCode、 Intellij 等应用均已内置集成 Gitea; • 支持通过 Gitea API 将 Gitea 与其他系统或工具集成,实现高效的工作流程。 集成简单 多种操作系统和数据库部署方式 简单的使用方式,多种的集成方式 简单易用 采用 Go 编写,资源占用为 GitLab的 1/4,运行速度为 GitLab 的 3 倍 相同机器配置:2C4G • 无负载时内存占用:GitLab0 码力 | 30 页 | 14.34 MB | 1 年前32023年中国基础软件开源产业研究白皮书
www.iresearch.com.cn 基础软件开源界限划分 操作系统、数据库、中间件、AI框架底层代码按规范进行共享与协作 本篇报告研究的基础软件开源范围,是指研究“开源”中“基础软件”板块的情况。开源过程中,参与者可以共享、协作完成开发, 正好与基础软件庞大的开发量需求 其意义惠及软件产业全领域。 注释:由于暂无国内厂商主导的开源编程语言,因而不列入本报告研究范围。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 对于这四类基础软件(操作系统、数据库、AI框架、中间件),其编写者将实现功能的代码按照一定的开源规范 开放,任何人可以查看、使用、贡献,同时,使用者也要遵循一定的开源规范。 基础软件开源范畴界定 国内基础软件开源界定 基础软件 杂等特点 中间件:不同系统和应用程序之间交互 与协作的桥梁 AI框架:具备构建和部署人工智能模型 的基础的全套开发工具 操作系统:是软硬件资源的资源管理者, 为用户与应用程序提供交互接口 数据库:通过对数据的访问与管理,支 持各种应用程序和业务的需求 编程语言:人与计算机交互的“语言”, 含编译器、基础编程语言、IED等 社区协作:鼓励各方在开放平台上协作 贡献,推动开源内容的发展 创新改进:通过资源共享与协作共生,0 码力 | 43 页 | 4.69 MB | 1 年前3
共 17 条
- 1
- 2