2024 中国开源开发者报告
系列凭借灵活的多尺寸选项,强大的多语言支持以及友好的模型授权功能, 赢得了社区开发者的高度评价。DeepSeek 通过引入多头潜在注意力(Multi-head Latent Attention, MLA)技术,在性能和成本上实现了革命性突破,开创高性价比的 AI 新纪元。 智谱的 CogVideoX 系列文生视频模型,成为全球首批开源的文生视频模型之一,不仅在 技术方面让中国视频生成模型列入领先梯队,强化了中国模型在全球范围的竞争力,也为国际开 数据资源整合,中国人工智能生态体系正在迅 速完善。这一趋势表明,未来中国有可能在全球人工智能领域占据更为核心的地位。 开源生态的繁荣与协作 随着开源模型影响力的提高,中国开源社区的活跃度也明显提升。无论是企业、研究机构还 是个体开发者都更加积极地参与到开源工作中。 以阿里巴巴的通义千问 Qwen 为例,据不完全统计,截止 2024 年 9 月,全球已有近 8 万基于 Qwen 的衍生模型,超越了 务管理暂行办法》 则明确了人工智能技 术的使用和合规要求,促进了开源模型在合规框架下良性发展。 变革 端上模型的兴起与隐私保护 随着小型模型的性能逐步增强,更多高级 AI 正转向在个人设备上运行。这一趋势不仅显著 降低了云端推理成本,还提升了用户隐私控制。 中国 AI 社区在这一领域也做了重要贡献,推出了如 Qwen2-1.5B、MiniCPM 系列和 DeepSeek Janus 等多款移动友好型模型。其中,最新发布的0 码力 | 111 页 | 11.44 MB | 8 月前32023 中国开源开发者报告
说起,前一年年底,ChatGPT 的横 空出世,标志着对话式 LLM 开始进入公众视野,为人们 提供了全新的人机交互方式。而 2023 年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 的台阶,为 LLM 的广泛应用奠定了基础。再之后的 11 月份,OpenAI 再发力,GPTs 的到来,“用户自定义 ChatGPT”的能力,更是让世人领略了 OpenAI 作为 LLM ChatGPT 类似,Claude 能够执行各种基于文字对话的任务,如文档搜索、 摘要、写作、编码,以及响应用户的提问。 四个月后,Anthropic 推出 Claude 2。Claude 2 改进了性能,响应时间更长, 可通过 API 访问。此外还上线了面向公众的 beta 网站 claude.ai。 2023 年 3 月 14 日,OpenAI 正式推出 GPT-4。 GPT-4 是多模态大型语言模型(Large 发布不久后,一款让这个最强大语言模型能够自主完成任务的开源项 目——Auto-GPT 横空出世,在 AI 领域掀起巨大的波澜。它就像是赋予了 GPT-4 记忆和实体一样,让它能够独立应对任务,甚至从经验中学习,不断 提高自己的性能。 Auto-GPT 是首批将 GPT-4 应用于自动执行任务的程序之一。 2023 年 11 月 17 日,OpenAI 突然发布公告,宣布 Sam Altman 将辞去首席 执行官一职,并离开0 码力 | 87 页 | 31.99 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
代信息技术下实现数字化转型的需求。 网易数帆依托网易二十余年互联网技术积累,系列软件基础平台产品和技 术方案,成熟应用于金融、零售、制造、能源、电信、物流等多个行业领 域,在技术先进性、性能优越性、产品成熟度及安全可靠性等方面得到了 各行业客户的验证。目前已服务各领域头部客户百余家,包括工商银行、 浙商银行、银监会、人保金服、深圳证券交易所、华泰证券、名创优品、 古茗、百胜集团、 信息化、数字化建设的商业闭环,同时也是希望为企业日常运营 管理提供数据监控、预警、决策支持,进一步提升现代农业企业 的科技含量和企业竞争力。 温氏集团 IT 负责人 温先生 温氏集团 网易数帆轻舟团队协助我们构建了大华统一产品服务中心,大幅 提升了不同产品线的信息交互效率。轻舟云原生平台使我们统一 了企业信息化标准,降低了运维难度,并提升了平台的稳定性和可 扩展性,改善了用户体验。后续将继续基于轻舟进行共享能力中 服务,打破企业软件应用中数 据孤岛等现状。 敏捷 通过小步快跑的方式敏捷迭 代,不断适应市场与业务需求 的变化,摆脱缓慢的大版本更 新与业务需求脱节的窘境。 高效 通过自动化与生产协作方式 的优化,多环节提升软件生产 的效率。 开放 基于开放的技术体系,打造开 放的软件架构。 轻舟云原生软件生产力平台 2.0 能力全景图 轻舟优势 搭建云原生技术底座,助力企业与时俱进实现云上软件创新,支撑业务高速发展。0 码力 | 43 页 | 884.64 KB | 1 年前32023年中国基础软件开源产业研究白皮书
持各种应用程序和业务的需求 编程语言:人与计算机交互的“语言”, 含编译器、基础编程语言、IED等 社区协作:鼓励各方在开放平台上协作 贡献,推动开源内容的发展 创新改进:通过资源共享与协作共生, 提升开源内容质量,并产生新的内容 自由共享:开源内容可以免费被任何人 查看、学习、使用 透明与可审查:开源的源代码可以被任 何人审查验证、保持质量 开源精神 通过传递一种对于知 识分享、知识透明和 以开源社区及代码托管平台为中心,各方合力促进产业源与端共生共长 发起者可以将源代码放在代码托管平台上,结合开发者的代码贡献进一步提升源代码质量。在这个代码优化的过程中,也有其他力 量辅助:1)开源基金会可选择性接受项目的捐赠并运营项目;2)开源技术论坛通常会提供更广阔的开发者交流平台,提升开发者 能力水平;3)开源社区评估机构可对开源社区进行评分,辅助开发者选择要参与的开源项目;4)开源产业联盟往往会对行业贡献 动力。我们看到,市场中一些开源项目因一段时间后仍无法看到明确的项目回报而以失败告终,逐渐被开源发起者抛弃。正因如此, 企业应转变短视思路,认识到开源是一种长期行为,对应制定长期战略。仅以投入产出比衡量开源项目收益将忽视开源对于企业在 提升技术领导力、增进创新力、构建活力生态、树立行业标准方面的贡献,短视的战略部署无法支撑企业持续投入,等到开源项目 的最终开花结果。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 开源项目长期投入要素及长期收益0 码力 | 43 页 | 4.69 MB | 1 年前3Moonshot AI 介绍
的关键组件;发明了Transformer-XL,是历史上第⼀个在词级别和字级别都全⾯超越RNN 的注意⼒语⾔模型,解决了语⾔建模上下⽂⻓度的关键问题,定义了语⾔建模的新标准;曾 与DeepMind和CMU合作研究,⾸次实现⼩样本性能逼近全监督学习的⾼效对⻬⽅法。 ii. 视觉⽅⾯。团队成员发明了MoCo,引爆了基于对⽐学习的视觉预训练范式,也是过去三年 CVPR引⽤量最⾼的⼯作;发明了ShuffleNet,最⾼效的视觉⽹络结构之⼀;主导开发了 Schulman亲⾃邀请加盟。 iv. 基础设施⽅⾯。团队核⼼成员曾带领数⼗⼈从零开发世界领先的深度学习框架,也具备数千 卡集群全⾃动化硬件运维告警、数百亿特征检索、⼤规模(数⼗PB数据、百万台机器)分 布式系统数量级性能优化的经验。 c. ⽬前团队⼈数超过80⼈,每个⽉都有在全球某个领域有显著影响⼒的⼈加⼊。 2.团队聚焦底层技术创新,技术Vision强 a. 引领⼤模型的“⽆损⻓上下⽂”时代。2 和中⽂能⼒上Kimi智能助⼿依然领先。 b. 聚焦底层技术创新,不⾛技术捷径。最早提出“LosslessLongContext可以解决90%以上的 模型定制问题”,坚持对数据的⽆损压缩,实现模型能⼒的提升,不⾛技术捷径(通过滑动窗 ⼝、降采样、⼩模型等技术实现上下⽂窗⼝延⻓,都是“技术捷径”) c. 通过这篇⽂章,您可以了解更多技术⽅⾯信息:专访⽉之暗⾯杨植麟:losslesslongcontextis0 码力 | 74 页 | 1.64 MB | 1 年前3中国开源软件产业研究报告
中国的开源产业已经初具规模,市场上涌现了一批自主开源的企业,并形成了开源社区、开 源产业联盟、开源基金会等开源组织,但整体来看,我国的开源软件产业尚处于发展初期, 长期发展还需要在制度、法律和文化等方面进行提升。 开源基金会前瞻:开源基金会是具备公益性、非盈利性以及非政府性的社会公益组织,国际 上知名的开源基金会有Linux基金会、Apache开源基金会、CNCF等。中国的开源基金会处 于发展初期,20 费提供给使用者,同时要求使用者遵循一定的开源规范。开源的发起者可以是个人、企业等 各种主体,聚焦企业开源领域,企业开源与商业化并不矛盾,开源软件的“引流”作用能够 帮助企业实现周边产品的增收、市场影响力的提升以及产业生态的协同构建。 3 开源软件概念铺陈 1 开源软件与云计算的关系 2 3 开源软件基金会前瞻 5 中国的开源软件法治建设状况 4 中国的开源软件产业发展洞察 4 ——《大教堂与集市》中文版,机械工业出版社 软件进行使用和反 馈来帮助开发者进行产品升级——这是一种只有在软件这样的产品上才能够实现的发展模式;然而,自由软件理念与企业 商业化运营背道而驰。随着计算机产业的发展,软件作为一种产品的商业价值显著提升,在当时的微软、IBM等IT龙头企 业的影响下,市场亟需一种结合了自由软件的创造力和私有软件的商业性的发展模式,1998年,“开源软件”理念在这一 背景下应运而生。 全球范围内开源软件理念发展历史简述0 码力 | 68 页 | 3.63 MB | 1 年前32021 中国开源年度报告
公司在购买开源产品时,多由工程团队负责人(技术总监 / 架构师 /TL)来进行产品的选择, 而且在同类型软件的购买中,半数的人会考虑软件供应商对开源社区的贡献,但不是主要 的考虑因素,只有在产品性能差别不大时,才会选择对开源社区贡献大的供应商。 参与者首次参与 / 转而参与开源项目的原因多为主观原因,例如更好的技能施展空间、更和谐的 社区氛围、更多的朋友,而应公司所在组织的要求来参与开源社区的占比很小。 公司在购买开源产品(基于开源项目的商业化产品)时,多由工程团队 负责人(技术总监 / 架构师 /TL)来进行产品的选择,而且在同类型软 件的购买中,半数的人会考虑软件供应商对开源社区的贡献,但不是主 要的考虑因素,只有在产品性能差别不大时,才会选择对开源社区贡献 大的供应商。 专家点评 姜宁:这里的开源产品是指基于开源项目的商业化产品吧!大部分的情况下,开源项目的选型是由在一线的开 发人员决定的,但是由于公司决策链 年底所爆发的 log4j 漏洞,是否会让公司购买开源产品更加保守谨慎?开源安全任重而道远。 3.6 受访者所从事的技术方向 受访者中非技术人员占比最高,后端开发次之,与去年相比,非技术人 员的比例大幅提升,说明开源已经越来越受到各行各业的关注。 注:非技术人员和学生是对受访者的不同维度的刻画,不太能确定非技 术人员中所包含学生的比例,有些学生可能会选择自己未来从事的职业 方向。 专家点评0 码力 | 132 页 | 14.24 MB | 1 年前32021 中国开源年度报告
公司在购买开源产品时,多由工程团队负责人(技术总监 / 架构师 /TL)来进行产品的选 择,而且在同类型软件的购买中,半数的人会考虑软件供应商对开源社区的贡献,但不是 主要的考虑因素,只有在产品性能差别不大时,才会选择对开源社区贡献大的供应商。 When companies buy open source products, the engineering team leader (technical 公司在购买开源产品(基于开源项目的商业化产品)时,多由工程团队负责人(技术总监/架 构师/TL)来进行产品的选择,而且在同类型软件的购买中,半数的人会考虑软件供应商对开 源社区的贡献,但不是主要的考虑因素,只有在产品性能差别不大时,才会选择对开源社区贡 献大的供应商。 When companies buy open source products (commercial products based on open 受访者所从事的技术方向 / 3.6 The technical direction of the respondents 受访者中非技术人员占比最高,后端开发次之,与去年相比,非技术人员的比例大幅提升,说 明开源已经越来越受到各行各业的关注。 The highest percentage of respondents are non-technical, followed by back-end0 码力 | 199 页 | 9.63 MB | 1 年前3全球开源发展态势洞察(2023年第八期)
全球开源态势洞察|第十期 03 Azure AKS正式推出网络方案 Azure CNI Overlay Azure CNI Overlay可以利用覆盖的网络来降低 IP地址的使用率,同时提供更好的性能和可扩 展性。借助该功能,AKS集群可以扩展至非常 大的规模,并且用户定义的私有CIDR还可以在 不同AKS集群中重复使用,从而大幅扩展了 AKS中运行的容器化应用程序可用的IP空间。 02 前沿技术 Japan正积极参与Meta- Decidim项目,在发展国际合作的基础上,与本 地开源社区开展密切合作,通过案例研究和讨论 会不断推进平台在本地的发展。旨在推广Decid- im在国际范围内的应用,并提升其本地化能力。 “我们的首要任务是深入地了解该地区企业在采 用和使用开源软件方面存在的困难和需求。”来 自芬兰东南应用科学大学的Open MemoryLab 项目经理Sami Jantunen指出。 2017年6月 2016年12月 2016年8月 2015年9月 2015年4月 PingCAP连续两年在CNCF全球贡献排行榜中位列中国企业第一位,全球排名第6位 TiDB通过信通院分布式数据库性能与基础能力两项评测 PingCAP团队的论文《TiDB: A Raft-based HTAP Database》入选VLDB 2020,成为业界第一篇 Real-time HTAP分布式数据库工业0 码力 | 22 页 | 1.99 MB | 1 年前32020 中国开源年度报告
做为 可塑性较⾼的群体,更容易跟随最近的开源热度,选择参与到开源。缺少 35-40 岁以上的开 发者,正⾯反应了中国资深⼯程师的缺乏。缘起中国的开源项⽬的⼤规模崛起,将⼗分依赖此 部分⼈的⽐例提升。 5.8 开源软件安全 有近七成的参与者表示不会有不安全感,但同时也仍有 25% 的参与者表示会有此类担忧,开 源软件的安全问题仍然值得我们关注。 【专家点评】 红薯:开源软件由于其机制 的⽅式做贡献之外,还⿎励更多开发者通过攻略、社群交流等其他⽅ 式参与贡献。所有开发者在使⽤过程中的问题都会得到社区的快速响应,也都纳⼊到新版本的 发布中来,通过这样持续闭环的打磨,项⽬质量得到保障和持续提升,更好地满⾜⼴⼤ AI 开 发者的使⽤需求,也让⼴⼤开发者形成了更强的社区认同感。 深度学习框架在 AI 技术栈中处于承上启下的位置,向下对接芯⽚,向上承接应⽤,与芯⽚⼴ 泛适配、深度融合优化 的道路上迈出了坚实的⼀步。从我们的数据上来看,接近 1/3 的 4.0 集群⽤上了 TiFlash。说明直接在 TP 的数据上作实时的数据洞察是普遍的需求。 其中可以感受到国内的开源氛围及开发者的活跃度也在逐步提升,我们从 2019 年底的 500+ contributor 到 2020 年底数字已经达到了 1,200+,⼤家对于开源项⽬的参与度与理解也越 来越深,越来越多的开发者在 TiDB 社区汇聚,通过0 码力 | 46 页 | 4.09 MB | 1 年前3
共 12 条
- 1
- 2