2021 中国开源开发者报告0 码力 | 35 页 | 36.74 MB | 1 年前3
2023 中国开源开发者报告1 1 /*使用电脑阅读,获得最佳体验 1 1 序 毫无疑问,开源开发者圈子来看,2023 年是大模型 LLM 年、生成式 AI GenAI 年。 一、 这自然要从 OpenAI 说起,前一年年底,ChatGPT 的横 空出世,标志着对话式 LLM 开始进入公众视野,为人们 提供了全新的人机交互方式。而 2023 年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 3 模型升级、Adobe 产品整合 LLM 能力、 语音模型 whisper-3 更新、AI 虚拟主播创造等,都是在 这条路上的进一步发展。 五、 AI 编程方面,Copilot 可以根据开发者的代码提示自动补 全代码,大大提高了开发效率。这也引发了代码原创性的讨 论,但它已经实实在在将 LLM 拉进了编程应用领域。 六、 LangChain 的出现,实现了 LLM 之间的链式交互,使多 的“卷大模型没意 义,卷应用机会更大”,其实很深刻地指出了内中区别。 本报告以开发者视角为主,从 LLM 切入,但实际上或多 或少与 GenAI 脱不开关系。 2023 年国内 LLM 发展活跃,从最初的百度文心一言“硬 刚”ChatGPT,到后来各式各样的大模型与产品出现,覆 盖了不同的领域和场景,构建了多元化的大模型生态。 大模型方面,百花齐放:百度的文心一言、抖音的云雀大模 型、智谱 AI0 码力 | 87 页 | 31.99 MB | 1 年前3
2024 中国开源开发者报告编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 大模型训练中的开源数据和算法:机遇及挑战 57 | 2024 年 AI 编程工具的进化 62 | AI 开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 | 推理中心化:构建未来 AI 基础设施的关键 Part 1:中国开源开发者生态数据 04 | Gitee 数据篇 Part 3:国内 GenAI 生态高亮瞬间 104 | 中国 GenAI 消费应用人气榜 Top10 15 | OSS Compass Insight 106 | AI 创新应用开发大赛获奖作品 设计:张琪 开发者是开源生态的重要支柱。 本章结合 、 的数据分 析,勾勒 2024 年中国开源开发者的整体画像趋势轮廓,主要 反映中国开源开发者使用开源大模型概况、开源项目/组织健康 度,以及中国开源社区的生态评估等情况。 Gitee 数据篇 本报告数据来源:2024年1月至2024年12月 Gitee及Gitee AI平台相关公开数据 4 / 111 开发者是社区的力量源泉0 码力 | 111 页 | 11.44 MB | 8 月前3
2023年中国基础软件开源产业研究白皮书本篇报告研究的基础软件开源范围,是指研究“开源”中“基础软件”板块的情况。开源过程中,参与者可以共享、协作完成开发, 正好与基础软件庞大的开发量需求相契合。这种契合性促进了基础软件良性、可持续性发展,并因为基础软件对上层软件生态有支 撑作用,基础软件的开源价值远超过单一产品的范畴,其意义惠及软件产业全领域。 注释:由于暂无国内厂商主导的开源编程语言,因而不列入本报告研究范围。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 使用开源许可证需注意的风险点 审判机关 开发者 开源许可证 “两者的契约” 开源者 将许可证视为“合同”,基于《著作权法》、 《专利法》等法律法规对相关纠纷进行判决 围绕许可证可能出现的其他风险 专利风险 数据风险 出口风险 其他风险 开发者商用开源代码时容易出现的违规风险:不同开源许可证对 于二次发行有不同程度的开源要求,要求越严格,开发者越难保护商 业版本发行的机密性,不知情企业闭源发行时越容易有侵权风险 常见许可证: • GPL ( 其 2.0 版 本不允许闭源发 行,3.0版本在 此之上设置了更 严格的开源要求) • AGPL ( 由 GPLv3修改而来, 开源要求进一步 涉及到了前端、 后端等衍生作品 生态) • 木兰公共许可证 开源许可证类别 6 ©2023.11 iResearch Inc.0 码力 | 43 页 | 4.69 MB | 1 年前3
中国开源软件产业研究报告来源:艾瑞咨询研究院自主研究及绘制。 摘要 SMS 开源与云计算:开源软件与云计算产业既有互相促进的良性合作,也有因利益纠纷带来的冲 突和矛盾。一方面,云计算产业的大量的基础软件都是开源软件,开源生态为云计算行业的 产品创新提供了持续的动力,而云服务企业的平台也为众多开源软件提供了市场分发渠道; 另一方面,由于全球范围内普遍存在云企业托管开源软件后不回馈开源社区的情况,二者的 发展理念也存在一定矛盾。 “引流”作用能够 帮助企业实现周边产品的增收、市场影响力的提升以及产业生态的协同构建。 3 开源软件概念铺陈 1 开源软件与云计算的关系 2 3 开源软件基金会前瞻 5 中国的开源软件法治建设状况 4 中国的开源软件产业发展洞察 4 ——《大教堂与集市》中文版,机械工业出版社 好的软件作品,往往源自于开发者的个人需要——按说这是显而易见的(正如 老话说“需要是发明之母”),但太多的软件开发人员并不需要也不热爱他们 与世界上绝大多数商品不同,使用一款软件不仅不会损耗它 的价值量,还有可能为之带来增长 开源软件理念的前身是美国计算机软件产业起步之时就在软件开发者群体中流传的“自由软件”理念,彼时这些开发者认 为软件不应该成为一种私有财产,而应该被公开成为公共资源,这样做的好处在于通过让海量的用户对软件进行使用和反 馈来帮助开发者进行产品升级——这是一种只有在软件这样的产品上才能够实现的发展模式;然而,自由软件理念与企业 商业化运营背道而驰0 码力 | 68 页 | 3.63 MB | 1 年前3
2021 中国开源年度报告许还会继续持续下去。 生态责任 在开源还只是一个小众群体的业余爱好时,几乎做任何事情,都是 自由的。但是,在软件吞噬世界、开源吞噬软件的今天,开源技术, 2021 中国开源年度报告 3 已经成为整个世界的基础设施之一。能力越大,责任越大。应用越广, 风险越高。我们应该如何思考与保障开源供应链安全呢?应该如何 建设更加健康的开源生态呢?在这样一种生态中,各方的责任又该 如何界定呢? ……………………… 66 6 2.4 新增开源项目领域分布 …………………………………………………………………………… 66 2.5 年度最受开发者关注的用户 ……………………………………………………………………… 67 2.6 年度最受开发者关注的组织 ……………………………………………………………………… 67 2.7 Gitee 指数 ………………………………………………………………………………………… 年中国开源社区参会调查报告》,随后的几年中,持续发 布了开发者调查报告,旨在从多种维度呈现国内的开源发展情况。今年我们再次启程,结 合数据分析手段和调查报告等多种形式,绘制一份 2021 年中国开源世界的地图。 这份问卷是每年中国开源年报的重要一环,不基于调研的分析报告不过是纸上谈兵。问卷 从两个角度展开,其中包括个人信息(包括工作信息和开发者技术信息)和开源社区参与 情况,与往年不同的是,今0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告continue. 生态责任 / Ecological responsibility 在开源还只是一个小众群体的业余爱好时,几乎做任何事情,都是自由的。但是,在软件吞噬 世界、开源吞噬软件的今天,开源技术,已经成为整个世界的基础设施之一。能力越大,责任 越大。应用越广,风险越高。我们应该如何思考与保障开源供应链安全呢?应该如何建设更加 健康的开源生态呢?在这样一种生态中,各方的责任又该如何界定呢? / Questionnaire 1、报告背景 / 1 Report Background 2016 年初,开源社发布了《2015 年中国开源社区参会调查报告》,随后的几年中,持续发布 了开发者调查报告,旨在从多种维度呈现国内的开源发展情况。今年我们再次启程,结合数据 分析手段和调查报告等多种形式,绘制一份 2021 年中国开源世界的地图。 In early 2016, KaiYuanShe open source scenarios in 2021. 这份问卷是每年中国开源年报的重要一环,不基于调研的分析报告不过是纸上谈兵。问卷从两 个角度展开,其中包括个人信息(包括工作信息和开发者技术信息)和开源社区参与情况,与 往年不同的是,今年我们加入了开源社区度量和开源商业化相关的话题,欢迎大家参与问卷并 发表自己的想法。 This questionnaire is an essential0 码力 | 199 页 | 9.63 MB | 1 年前3
2020 中国开源年度报告
⼀⽅⾯,是开源这么多年⼀直持续的上升势头。⽽另⼀⽅⾯,则是我们的⼀个猜测:疫情以 来,越来越多的⼈开始远程办公,事实上促进了更多的⼈有机会“斜杠化”,也就是在⼀台电脑 ⾯前⽅便地切换多种身份,以异步的⽅式处理多种事务,从⽽增加了开发者参与开源的时间和 机会。 当然,同样由于远程办公,虚拟世界在⼈类⽣活中的占⽐,变得更⼤了。这样是否更好,还会 引发哪些问题?作为站在隧道⼝的⼈类,其实是猜不透的。 2. 中国开源崛起以及开源世界分裂的趋势 年中国开源社区参会调查报告》,随后的⼏年中,持续发 布了开发者调查报告,旨在从多种维度呈现国内的开源发展情况。今年我们再次启程,结合数 据分析⼿段和调查报告等多种形式,绘制⼀份 2020 年中国开源世界的地图。 这份问卷是每年中国开源年报的重要⼀环,不基于调研的分析报告不过是纸上谈兵。在往年的 基础上,我们参考了其他现存的主流开发者问卷内容,并加⼊了⼀些新的视⻆。基于 2020年 COVID-19 通过近 60 项左右问题的统计调查与分析,我们希望能够还原出当前中国开源社区的真实现 状,从⽽为开源的后来⼈提供权威的参考。 调查对象:覆盖开发者、社区成员、贡献者、学⽣、政府企业管理⼈员 调查内容:主要涵盖个⼈信息、⼯作状况、开源社区以及开发者技术 调查⽅法:以在线问卷⽅式搜集样本和数据,交叉对⽐法分析数据 推⼴⽅法:线上社交媒体、博客、开源社、开源中国⽹站 问题数量:590 码力 | 46 页 | 4.09 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)v2.5 发布 D2iQ Kubernetes Platform(DKP)是适应生 产环境的企业级自主可控Kubernetes平台。 DKP基于开源Kubernetes、云原生工作负载及 整个云原生生态系统,助力企业获取数字化敏 捷性。 近日,D2iQ Kubernetes Platform v2.5发布, 版本特性更新如下: • 支持将独立的DKP Essential集群扩展到DKP 企业管理集群下进行集中管理; 定位于在线事务 处理/在线分析处理的融合型数据库产品,实现了一键水平伸缩,强一致性的多副本数据安全,分 布式事务,实时OLAP等重要特性。同时兼容MySQL协议和生态,迁移便捷,运维成本极低。TiDB 社区是由 TiDB 生态中的开发者、用户、Contributor、合作伙伴一起建立的分享、学习平台。截至 目前,TiDB社区有超过96K请求、20K主题、196K帖子、2100贡献者。 TiKV:T 云原生混沌工程测试平台Chaos Mesh升级成为CNCF孵化项目 TiDB 连续24个月在墨天轮国产数据库流行度排行榜上排行第一 TiDB Cloud Developer Tier发布,向开发者提供为期一年的免费试用 Chaos Mesh 2.0正式GA PingCAP携手CCF,成为VLDB Summer School独家协办单位 PingCAP加入CNCF,成为银牌会员;面向企业级核心场景的TiDB0 码力 | 22 页 | 1.99 MB | 1 年前3
Gitea,新一代的代码托管平台其他能力 1 Gitea 开源项目介绍 Gitea 企业版介绍 3 Gitea 优势总结 2 极佳体验 接近 GitHub 使用体验 + 兼容 GitHub API、Actions、操作语法生态 + 本地化部署 简单易用 多种操作系统和数据库部署方式 简单的使用方式,多种的集成方式 卓越性能 采用 Go 语言编写,资源占用仅 为 GitLab 的 1/4,运行速度约为 GitLab 100+ 配置项,40+ 模块配置, 通过灵活的配置满足不同应用场景的需求 安全稳定 被⼴泛验证,39k+ GitHub Star、40万+ 安装量、 1000+ 贡献者,覆盖 1000万+ 开发者 Gitea 优势总结 极佳体验 • 在 UI 上与 GitHub 采用类似的风 格设计; • 在使上与 GitHub 保证一致的使用 体验。 风格兼容 • API 高度兼容:大部分 三方应用可复用; • Actions 高度兼容:大部分 GitHub Actions 插件可复用; • 工作流程/操作语法兼容:与 GitHub Actions 工作流程、操作语 法高度兼容。 生态兼容 • 类 Github 的使用体验,使用习惯无缝衔接; • 完全兼容 Git 命令,无额外学习成本; • 提供 Tea 命令,操作方便、快捷、高效。 使用简单 • 支持多种部署方式,几条命令快速安装和升级0 码力 | 30 页 | 14.34 MB | 1 年前3
共 12 条
- 1
- 2













