2024 中国开源开发者报告与发展,为开发者和企业带来更多价值,助力知识共享与技术协作。 Lu Cheng Hugging Face Fellow,致力于推动 AI 和开源软件的采纳和开发者 体验。拥有超过十年的开发者关系、产品营销和开源生态构建的经验, 曾在 Google 负责多个开发技术的深度推广和社区建设,包括 Android、Flutter 和 TensorFlow 等。他坚信开源是推动技术进步和 开发 无商业限制的基座的可能性也很高。小应 用开发商很可能很容易获得一个低成本 serving 的“量化小基座”。 “7B”是一个 magic number!无论是 RAG 里的向量表征模型,还是文生图、文本识别 (OCR)、语音合成(TTS)、人脸识别等等垂直领域,一个 1B~7B 的小模型已经可以满足很 多生产、应用需要,并且效果也在逐步推高【8,9,10】。这些模型,作为智能体的“三头六臂”, 确实好用,包括新推出的“光标位置预测” 功能。 但是 AI 编程发展没有那么快,在国内生成代码采纳率还比较低,根据《2024 软件研发应 用大模型国内现状调研报告》,多数团队在 10-40%之间,如图 1 所示。 图 1 大模型(LLM)在编程上的应用及其生成代码的采纳率 在 2024 年,我们还看到了“AI 程序员”Devin 的诞生,Devin 能够独立完成复杂的编码和 调试任务、自主查找和修复代码库中的错误,构建和部署应用程序。在0 码力 | 111 页 | 11.44 MB | 8 月前3
2023 中国开源开发者报告多地还是在 LLM 这一层面,Robin Li 的“卷大模型没意 义,卷应用机会更大”,其实很深刻地指出了内中区别。 本报告以开发者视角为主,从 LLM 切入,但实际上或多 或少与 GenAI 脱不开关系。 2023 年国内 LLM 发展活跃,从最初的百度文心一言“硬 刚”ChatGPT,到后来各式各样的大模型与产品出现,覆 盖了不同的领域和场景,构建了多元化的大模型生态。 大模型方面,百花齐放:百度的文心一言、抖音的云雀大模 the Enterprise”报告显示: 54% 的 AI 用户预计 AI 的最大好处是提高生产力。 77% 的受访者使用 AI 来辅助编程。其中提到的具体 应用包括欺诈检测、教学和客户关系管理。 AI 用户表示,AI 编程(66%)和数据分析(59%) 是最需要的技能。 许多 AI 采用者仍处于早期阶段:26% 的人使用 AI 不到一年,而 18% 的人已经在生产中进行了应用。 ChatGLM-6B 大模型 GPT-4 发布不久后,一款让这个最强大语言模型能够自主完成任务的开源项 目——Auto-GPT 横空出世,在 AI 领域掀起巨大的波澜。它就像是赋予了 GPT-4 记忆和实体一样,让它能够独立应对任务,甚至从经验中学习,不断 提高自己的性能。 Auto-GPT 是首批将 GPT-4 应用于自动执行任务的程序之一。 2023 年 11 月 17 日,OpenAI 突然发布公告,宣布0 码力 | 87 页 | 31.99 MB | 1 年前3
2020 中国开源年度报告
但是,接下来应该怎么发展呢?为了抗击疫情⽽凝聚起来的⼈,创造的项⽬,积累的经验,总 结的教训,应该如何“整理、封装、模块化”,并为了今后的各种意外,做好准备呢?这些都是 值得⻓期思考并改进的领域。 作为⼀份⼒图完整、客观、全⾯、丰富的报告,值得探讨的问题当然不⽌上述这些,也欢迎朋 友们阅读下⾯的报告,并随时与我们交流。 庄表伟,开源社理事⻓ 2021 年 1 ⽉ 16 ⽇ 特邀点评专家: 吴晟,Apache 年以代码和测试为主转变为以代码和⽂档为主,社区和项⽬正在 意识到⽂档的重要性,更多开源贡献者投⼊到了⽂档撰写中; 开源活动的参与频率相较往年有所上升,这与国内愈发繁荣的开源氛围和逐渐丰富的开源 活动也有关系。81% 的开发者认为开源活动对促进和推动开源社区⾄关重要。⽽对于更 倾向于线上还是线下的会议,结果竟惊⼈地持平; 在 2020 年 COVID-19 这个⼤背景下,各⾏各业都不可避免受到了冲击和影响;82% 也是值得关注的现象。 【专家点评】 吴晟:微信、QQ 群的⾼强度使⽤,仍然显示出开源圈⼦缺少国际化社交和协作能⼒的⼀贯性 短板。同样反映出中⽂依然是绝⼤部分的开源参与者唯⼀热衷的交流⽅式。 5.6 社区与代码的关系 有近九成的参与者认为在开源社区中,社区的价值⼤于或等同于代码,因为围绕代码⽽⽣的社 区,会让代码变得更加优秀。 【专家点评】 ⾼阳:很⾼兴看到⼤家对于社区价值的认同,在我们看来,⼀个健康的社区远⽐优秀的代码更0 码力 | 46 页 | 4.09 MB | 1 年前3
Moonshot AI 介绍leNet,最⾼效的视觉⽹络结构之⼀;主导开发了 detectron2,⼀个被⼴泛使⽤的视觉开源项⽬并被集成到Meta全线VR/AR产品中。 iii. 强化学习⽅⾯。团队成员作为⼀作提出了基于关系学习的少样本⽅法,得到斯坦福⼤学、 Google、MIT、Amazon等团队的使⽤和扩展,并获得过OpenAIRL联创及负责⼈John Schulman亲⾃邀请加盟。 iv. 基础设施⽅ 专业解读⽂件:⽆论是⾦融分析、法律咨询还是市场调研,Kimi都能以专业⽔准提供⽀持。超⻓⽂ 档、多个⽂件,都可以快速摘要、翻译、答疑,⽀持上传PDF、Word、Excel、PPT、TXT⽂件和 图⽚。 • 整理资料:⽆论是堆积如⼭的发票,还是复杂冗⻓的会议记录,Kimi都能智能识别整理,⾃动提取 关键点,让资料整理不再繁琐,信息⼀⽬了然。 • 辅助创作:根据你提供的⽹⻚链接、⽂件、指令 重要的是理解两者之间的关系。 AGI和产品对我们来说并不是⼿段和⽬的的关系,两个都是⽬的。同时,在追求AGI的过程中,我认为 所谓的数据⻜轮是很重要的,尽管它是⼀个⽼套的概念。 像ChatGPT这样的产品,还没有完全建⽴起基于⽤⼾数据的持续进化。我觉得这很⼤程度上是base model还在进化,进化了⼀代,之前的⽤⼾数据就没什么⽤了。这跟发展阶段有关系⸺现 在“吃”的0 码力 | 74 页 | 1.64 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)CON将举办全球最大规模AI黑客大赛 微软将用近一年时间完成对0-day Secure Boot漏洞的修复工作 06 06 04 开源热点 芬兰南萨沃计划建立开源能力中心 Decidim参与式民主的开源平台正在被日本广泛使用 图林根继续支持开源替代方案 07 07 08 09 10 11 16 06 开源创业企业 PingCAP平凯星辰 07 开源报告 开源软件国家情报报告-捷克 05 开源法律速览 案例分享:全国首例GPL抗辩获得支持案 提案等流程参与政府政策法规的制定过程来实现数 字民主。 全球开源态势洞察|第十期 08 图林根继续支持开源替代方案 德国图林根自由州与OpenTalk团队的合作成果在Chemnitzer Linux-Tage大会上宣布并展示。 在该会议中,Peer Heinlein(OpenTalk首席执行官)与Christian Stötzer(图林根自由州财政 部负责人)就“图林根自由州的IT战略:开源与数字主权”进行联合演讲。Peer 德国图林根自由州已经表明了其对开源项目的支持。其一,在2019年设立开源奖(图林根开源 奖由图林根经济、科学和数字社会部发起,旨在提高开源解决方案的认知度),其获奖者包括 edu sharing、in.RET、IG Papiergraben。其二,在2019年该州议会通过了一项关于公共采购 的规定,明确将开源定义为“源代码公开可访问且许可证不限制其使用、分发和修改的软件解决 方案”。图林根州公共采购法(Thüringer Ve0 码力 | 22 页 | 1.99 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021新与业务需求脱节的窘境。 高效 通过自动化与生产协作方式 的优化,多环节提升软件生产 的效率。 开放 基于开放的技术体系,打造开 放的软件架构。 轻舟云原生软件生产力平台 2.0 能力全景图 轻舟优势 搭建云原生技术底座,助力企业与时俱进实现云上软件创新,支撑业务高速发展。 12 PRODUCT 首批通过信通院认定项目:首批可信云·微服务先进级评估;首批可信云·服务网格先进级评估 PRODUCT 基于可视化编程语言 基于通用语言封装的可视化开发语言,具 备完善的静态类型系统和组件扩展机 制,适合 80% 企业级应用开发,灵活性 高,可靠性强。 数据模型驱动 可视化构建实体、数据结构、枚举等低 代码数据模型,自动生成数据库表和页 面交互。 支持企业集成 能够通过 API 集成企业内部的服务,实 现应用组装。 业务与流程融合 流程引擎基于 BPMN2.0 规范,可视化 任务运维 文件管理 任务开发 租户管理 自助分析 权限管理 可视化调度 数据开发及管理平台 标签画像 消费者运营平台 机器学习平台 BI 有数优势 有数全链路数据生产力平台2.0能力全景图 易用 覆盖企业数据全链路的大数 据产品,全面降低数据使用门 槛。 开放 专注大数据技术领域,核心 技术自主可控,支持多云和跨 云部署。 高效 联动数据链路多环节,从系统 层面加快业务高效运营和有0 码力 | 43 页 | 884.64 KB | 1 年前3
2021 中国开源年度报告到 59,7,1% 40 到 49,34,6% 30 到 39,120,22% 参与者年龄分布 参与者性别分布 男 女 男,441,82% 女 ,96,18% 14 注:问卷篇中饼图的数据标签,例如“硕士 ,107,20%”,其中硕士表 示选项,107 是选择该选项的人数,20% 是选择该选项人数所占的比例。 专家点评 堵俊平:整体而言,在开源领域,男性在参与人数上仍然占据绝对优势,这一点和 要的考虑因素,只有在产品性能差别不大时,才会选择对开源社区贡献 大的供应商。 专家点评 姜宁:这里的开源产品是指基于开源项目的商业化产品吧!大部分的情况下,开源项目的选型是由在一线的开 发人员决定的,但是由于公司决策链的关系,商业产品的购买还是要通过公司领导,工程团队负责人进行决策。 堵俊平:由于技术领域的发展日新月异,技术采购决策权下沉至工程团队技术负责人的趋势是不可避免的。这 同时也要求技术产品的采购在决策流程 3.15 数据库 数据库使用情况中,不出意外地,MySQL 以绝对优势遥遥领先,SQL Server 与 Oracle 跟随其后。 专家点评 段夕华:Mysql 和 Postgres 的对比关系也有国内外差异,估计还是惯性使然 26 3.16 版本控制工具 毫无疑问的是,Git 一枝独秀,具有绝对性优势。SVN、TFS、CVS 目 前仍有不少参与者在使用。 3.17 AI 开发框架0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告注:问卷篇中饼图的数据标签,例如“硕士,107,20%”,其中硕士表示选项,107 是选择该选项 的人数,20%是选择该选项人数所占的比例。 Note: The data labels of the pie chart 【专家点评】/ [Expert Comment] 姜宁:这里的开源产品是指基于开源项目的商业化产品吧!大部分的情况下,开源项目的 选型是由在一线的开发人员决定的,但是由于公司决策链的关系,商业产品的购买还是要 通过公司领导,工程团队负责人进行决策。 Jiang Ning: Are the open source products herein referred to as commercial with SQL Server and Oracle trailing behind. 【专家点评】/ [Expert Comment] 段夕华:Mysql 和 Postgres 的对比关系也有国内外差异,估计还是惯性使然 Duan Xihua: The comparison between Mysql and Postgres is also different at home0 码力 | 199 页 | 9.63 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书www.iresearch.com.cn 开源产业链关系 以开源社区及代码托管平台为中心,各方合力促进产业源与端共生共长 发起者可以将源代码放在代码托管平台上,结合开发者的代码贡献进一步提升源代码质量。在这个代码优化的过程中,也有其他力 量辅助:1) 供更全面、更丰富的解决方案。这种融合不仅有助于促进用户之间的无缝交互,也为开发者提供了更多的创新空间和灵活性。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 openEuler连接全景图 主流场景100%支持 | 含3.5W+主流应用 + + 工业控制 云原生 大数据 CDN MEC … 覆盖全场景应用 支持多样性设备 服务器 边缘计算 嵌入式 云计算 主流计算架构100%覆盖 戴还是其他智能终端设备,OpenHarmony都能提供高效、稳定的操作系统支持,为用户带来优质的智能体验。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 OpenHarmony架构与应用全景图 一套开发框架支持应用 运行于不同的设备形态 一套架构积木化拼装, 对轻量、小型、标准场 景设备提供系统支持 硬件生态丰富,通用处 理器与各类加速器全覆 盖 将单用户的多种终端整 合为单一虚拟终端0 码力 | 43 页 | 4.69 MB | 1 年前3
中国开源软件产业研究报告各种主体,聚焦企业开源领域,企业开源与商业化并不矛盾,开源软件的“引流”作用能够 帮助企业实现周边产品的增收、市场影响力的提升以及产业生态的协同构建。 3 开源软件概念铺陈 1 开源软件与云计算的关系 2 3 开源软件基金会前瞻 5 中国的开源软件法治建设状况 4 中国的开源软件产业发展洞察 4 ——《大教堂与集市》中文版,机械工业出版社 好的软件作品,往往源自于开发者的个人需要——按说这是显而易见的(正如 www.iresearch.com.cn 来源:艾瑞咨询研究院自主研究及绘制。 开源产业主体及产业关系 开源社区运营为核心,注重开源用户和贡献者的反馈 从产业主体的角度上看,开源软件产业市场上的主体包括软件的源作者(个人/企业)、开源基金会、开源社区(包括代码 托管平台、软件论坛、行业联盟)、二 市场推广、版 本迭代更新、版权管理和安全管理等内容,这些环节和商业企业的软件项目有一些相似之处,但更加注重从社区的使用者 和贡献者处得到观点和启发,并用以驱动项目未来的发展。 开源软件主体和产业链关系 源作者 软件作品 企业开源 开源基金会 开 源 社 区 代码托管平台 开源软件论坛 专家指导 产业联盟 法律服务 市场宣传 二次开发者 软件用户 • 开源代码的源作者/最初贡献0 码力 | 68 页 | 3.63 MB | 1 年前3
共 11 条
- 1
- 2













