2023 中国开源开发者报告
1 1 /*使用电脑阅读,获得最佳体验 1 1 序 毫无疑问,开源开发者圈子来看,2023 年是大模型 LLM 年、生成式 AI GenAI 年。 一、 这自然要从 OpenAI 说起,前一年年底,ChatGPT 的横 空出世,标志着对话式 LLM 开始进入公众视野,为人们 提供了全新的人机交互方式。而 2023 年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 Google 紧随其后推出 Bard,作为其首次亮相的对话 LLM 产品,无疑具有其里程碑意义,尽管它的首秀并不尽 如人意,车翻了又翻。 三、 Claude 2、PaLM 2、Llama 等模型与产品也展现了 LLM 在语言理解和多模态处理能力方面的探索,甚至 Claude 2 还一度被誉为实力可以硬刚 ChatGPT。而 Meta 开源的 Llama 2 更成为了 LLM 领域开源势力的典型代表,它的 广大的个人用户和创意行业提供了强有力的工具,彻底改变 了数字艺术内容的创作方式。同时,它们也引发了人工智能 在创作领域的伦理和法律讨论。LLM 杀进多媒体领域。往 后 DALL-E 3 模型升级、Adobe 产品整合 LLM 能力、 语音模型 whisper-3 更新、AI 虚拟主播创造等,都是在 这条路上的进一步发展。 五、 AI 编程方面,Copilot 可以根据开发者的代码提示自动补 全代码,大大0 码力 | 87 页 | 31.99 MB | 1 年前32023年中国基础软件开源产业研究白皮书
www.iresearch.com.cn 基础软件开源界限划分 操作系统、数据库、中间件、AI框架底层代码按规范进行共享与协作 本篇报告研究的基础软件开源范围,是指研究“开源”中“基础软件”板块的情况。开源过程中,参与者可以共享、协作完成开发, 正好与基础软件庞大的开发量需求 对于这四类基础软件(操作系统、数据库、AI框架、中间件),其编写者将实现功能的代码按照一定的开源规范 开放,任何人可以查看、使用、贡献,同时,使用者也要遵循一定的开源规范。 基础软件开源范畴界定 国内基础软件开源界定 基础软件 具备能衍生出并支撑 多个技术簇的一类根 技术软件,拥有技术 门槛高、衍生场景复 杂等特点 中间件:不同系统和应用程序之间交互 与协作的桥梁 AI框架:具备构建和部署人工智能模型 的基础的全套开发工具 的基础的全套开发工具 操作系统:是软硬件资源的资源管理者, 为用户与应用程序提供交互接口 数据库:通过对数据的访问与管理,支 持各种应用程序和业务的需求 编程语言:人与计算机交互的“语言”, 含编译器、基础编程语言、IED等 社区协作:鼓励各方在开放平台上协作 贡献,推动开源内容的发展 创新改进:通过资源共享与协作共生, 提升开源内容质量,并产生新的内容 自由共享:开源内容可以免费被任何人0 码力 | 43 页 | 4.69 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
云计算开源产业联盟云原生十大优秀案例 infoQ 中国技术力量年度榜单 InfoQ2020 最有价值技术团队 InfoQ2020 最佳技术社区驱动力奖 思否 SegmentFault 中国技术品牌影响力企业 DTCC 第十一届中国数据库技术大会创新产品奖 《Gartner 2021 中国 ICT 技术成熟度曲线》数据中台领域标杆厂商 信通院可信云计算最佳实践服务网格 2021 数博会“十佳大数据案例” 《Gartner 2019中国 PRODUCT 基于可视化编程语言 基于通用语言封装的可视化开发语言,具 备完善的静态类型系统和组件扩展机 制,适合 80% 企业级应用开发,灵活性 高,可靠性强。 数据模型驱动 可视化构建实体、数据结构、枚举等低 代码数据模型,自动生成数据库表和页 面交互。 支持企业集成 能够通过 API 集成企业内部的服务,实 现应用组装。 业务与流程融合 流程引擎基于 BPMN2.0 规范,可视化 流程开发,可支持如请假、入职、离职等 数仓设计中心 指标设计 模型设计 数据治理中心 数据质量 数据地图 数据资产 数据标准 UDF管理 任务开发 版本管理 任务运维 资源管理 任务上线 数据服务中心 智能BI 数据准备 大屏 自助取数 移动应用 数据填报 全渠道 数据融合 会员 标签管理 用户分群 营销 活动管理 投放数据 追踪 活动数据 分析 特征治理 模型管理 交互式建模 可视化建模0 码力 | 43 页 | 884.64 KB | 1 年前3全球开源发展态势洞察(2023年第八期)
Face、微软、英伟达与Stability AI等 顶尖人工智能提供商,共同参与对生成式人工 智能系统的公开安全评估。 AI Village组织方将这个合作活动描述为“有史 以来规模最大的人工智能模型红队演习”。将 有数千人参与对公共人工智能模型的评估,期 间使用的评估平台由Scale AI负责开发。 近日,微软发布了一个补丁,用于修复Secure Boot绕过漏洞。在2023年1月份,微软释出补 丁修复了编号为CVE-2022-21894的漏洞,但 多的人了解如何开展红队测试和评估人工智能模 型,才能解决这些模型中的各种问题。”通过对 人工智能模型组开展最大规模的红队演习,AI Village和DEF CON希望能培养出处理人工智能 系统漏洞的研究者社区。事实证明,大语言模型 的锁定难度远超想象,部分原因在于所谓“提示 词注入”技术。人工智能研究员Simon Willison 详细介绍了提示词注入的危险,这种技术可以令 语言模型偏离正轨,执行创建者想要回避的操 作。在DEF CON大会期间,参与者将通过主办方 提供的笔记本电脑定时访问多个大语言模型。并 将会有一个夺旗式的积分系统,促进测试各种潜 在威胁。积分最高的参与者将获得英伟达高端 GPU作为奖品。AI Village公告中写道,“我们将 公布从此次竞赛中得到的启发,帮助其他想要做 类似尝试的人们。希望越来越多的人能知晓该如 何使用大语言模型,了解这些模型的局限性。” 注释:“红队”测试,是指安全专家尝试在组织系0 码力 | 22 页 | 1.99 MB | 1 年前32021 中国开源年度报告
Python 开发框架 ………………………………………………………………………………… 23 3.14 前端开发框架 …………………………………………………………………………………… 24 3.15 数据库……………………………………………………………………………………………… 25 3.16 版本控制工具 …………………………………………………………………………………… 26 3.17 AI 开发框架 借鉴。 堵俊平:这两年,一个很明显的趋势是越来越多的初创企业参与开源。这一方面得益于 ToB 赛道成为市场和 政策导向的热点,另一方面开源所代表的开放式创新也被投资界所认可。尤其是开源与数据(数据库 & 大数据) 以及 AI 等热点技术相结合,更是为市场带来了极大的想象空间。 参与者所在企业类型 外企 国内初创公司 国内大型互联网企业 国企 / 央企 / 事业单位 其他 外企,25,10% 段夕华:这个数据有点意思,React 居然屈居 Vue 之后,好像跟国外的统计数据不太一致。不知道是样本容 量问题,还是因为国内开源项目对华人发起的 Vue 情有独钟。 2021 中国开源年度报告 25 3.15 数据库 数据库使用情况中,不出意外地,MySQL 以绝对优势遥遥领先,SQL Server 与 Oracle 跟随其后。 专家点评 段夕华:Mysql 和 Postgres 的对比关系也有国内外差异,估计还是惯性使然0 码力 | 132 页 | 14.24 MB | 1 年前32024 中国开源开发者报告
观 点 编委会 21 | 2024 年中国开源模型:崛起与变革 26 | 开源模型未必更先进,但会更长久 30 | 大模型撞上“算力墙”,超级应用的探寻之路 36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 大模型训练中的开源数据和算法:机遇及挑战 57 | 2024 开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 | 推理中心化:构建未来 AI 基础设施的关键 Part 高瞻,Gitee AI 运营 设计:张琪 开发者是开源生态的重要支柱。 本章结合 、 的数据分 析,勾勒 2024 年中国开源开发者的整体画像趋势轮廓,主要 反映中国开源开发者使用开源大模型概况、开源项目/组织健康 度,以及中国开源社区的生态评估等情况。 Gitee 数据篇 本报告数据来源:2024年1月至2024年12月 Gitee及Gitee AI平台相关公开数据 4 / 1110 码力 | 111 页 | 11.44 MB | 8 月前3中国开源软件产业研究报告
www.iresearch.com.cn 来源:艾瑞咨询研究院自主研究及绘制。 企业的开源商业模型(一) 软件开源为企业带来直接收益、渠道收益、行业生态收益 从商业成功的角度上看,企业发布开源软件能够为自身带来直接商业化收益、渠道收益和市场影响力提升带来的产业协同 收益。其中,直接商业化收益 企业实施软件开源战略的商业模型 企业之内 企业之外 软件开源 用户增长 加速创新 产品升级 提供付费订阅版本 提供专业配套服务 引流产生广告收入 直接 商业化 渠道化 为互补产品宣传、导流 提升企业市场声量 产业级影响 促进协同产品出现和创新 构建开源产业基金会 e.g. Linux发行版 e.g. Google浏览器 e.g. 开源数据库托管 产 业 协 同 cn 来源:艾瑞咨询研究院自主研究及绘制。 企业的开源商业模型(二) 就市场推广而言,软件开源通常能更快实现用户触达 建立在企业进行开源软件运营的基础上,开源对企业的商业价值通常通过“引流”来实现,在某种意义上,这可以类比为 一些2C的软件“先免费,再收费”或“免费软件+付费服务”的业务模式。如果我们以软件产业商务拓展的双漏斗模型来 衡量开源战略的商务价值,对比常规的闭源商业软件业务模式,开0 码力 | 68 页 | 3.63 MB | 1 年前32021 中国开源年度报告
learning. 堵俊平:这两年,一个很明显的趋势是越来越多的初创企业参与开源。这一方面得益于 ToB 赛道成为市场和政策导向的热点,另一方面开源所代表的开放式创新也被投资界所认 可。尤其是开源与数据(数据库&大数据)以及 AI 等热点技术相结合,更是为市场带来 了极大的想象空间。 Du Junping: In the past two years, a clear trend has been that overwhelming advantage. SVN, TFS, and CVS are still in use by many participants. 3.16 数据库 / 3.16 Database 数据库使用情况中,不出意外地,MySQL 以绝对优势遥遥领先,SQL Server 与 Oracle 跟 随其后。 Not surprisingly, MySQL leads the increase their talent pool to accelerate product development. 2.2.2 开源软件具有的 Product-Led Growth(PLG)模型特征可以促进付费转化 The Product-Led Growth (PLG) model features of open source software could facilitate0 码力 | 199 页 | 9.63 MB | 1 年前32020 中国开源年度报告
作为当时开源项⽬的主战场,Linux 操作系统、 桌⾯办公软件(GNOME, OpenOffice)和浏览器(Mozilla)掀起了第⼀波开源的浪 潮;近年来随着互联⽹的兴起,开源的项⽬和技术越来越百花⻬放,从数据库到中间 件,从前端到后端,从编程语⾔到编译器,从物联⽹到微服务,从⼤数据到⼈⼯智能, 开源的技术和项⽬越来越丰富和多样化。 4、开源⼯作现状 4.1 接触开源的时间 有近三成参与者接触开源的时间在 品和操作系统相关产品仍然是⼤家了解 和接触开源的最初窗⼝。 4.7 最希望能够开源的产品 相⽐于 2019 年,开发⼯具在今年成为⼤家最希望能够开源的产品类型第⼀名,紧接着的是操 作系统,数据库产品与中间件产品也是很多⼈希望能够开源的产品类型。 4.8 企业对开源的贡献 在参与者眼中,GitHub 对于开源软件的贡献最⼤,其次是 Google,⽽在国内企业中, Alibaba、Huawei 今年仍然是最受欢迎的编辑器,紧随其后的是 vim 以及 notepad++。 6.4 版本控制⼯具 毫⽆疑问的是,Git ⼀枝独秀,具有绝对性优势。SVN、TFS、CVS ⽬前仍有不少参与 者在使⽤。 6.5 数据库 数据库使⽤情况中,不出意外地,MySQL 以绝对优势遥遥领先,MongoDB 与 PostgreSQL 跟随其后。 6.6 操作系统 操作系统的使⽤中,Windows、Linux、MacOS X0 码力 | 46 页 | 4.09 MB | 1 年前3JumpServer ⼴受欢迎的开源堡垒机
3 5 ⽬ 录 各种类型 的 IT 资产 为什么要使⽤堡垒机? - 以更安全、更⾼效的⽅式管控和登录各种类型的资产 - 系统管理员 普通⽤户 外包⼈员 临时访客 服务器 ⽹络设备 数据库 Kubernetes 事前授权 事中监察 事后审计 管理者期望 堡垒机的 4A 能⼒ 身份鉴别 Authentication 授权控制 Authorization 安全审计 Auditing Razor Magnus Kael Tinker Panda KoKo Linux、命令⾏数据库等连接管理; Lion 浏览器图形化连接管理 Windows 资产; Razor 传统客户端连接管理 Windows 资产; Chen 浏览器图形化连接管理数据库; Magnus 传统客户端连接管理数据库资产; Kael 连接管理 GPT 资产; Tinker 基于 Windows 操作系统的应⽤发布连接管理; 强⼤的市场影响⼒:堡垒机 = JumpServer JumpServer 堡垒机的特⾊功能 体验极佳的 Web Terminal ⼴泛的 多云管理⽀持 超⼤规模 分布式资产⽀持 全⾯的数据库 运维安全审计⽀持 ⽀持审计录像 的云端存储 内置多组织体系 强⼤的 远程应⽤发布能⼒ 灵活的 软件 / 硬件 部署⽅案选择 1 3 6 8 2 4 5 7 体验极佳的0 码力 | 40 页 | 6.66 MB | 1 年前3
共 12 条
- 1
- 2