2021 中国开源开发者报告0 码力 | 35 页 | 36.74 MB | 1 年前3
2023 中国开源开发者报告1 1 /*使用电脑阅读,获得最佳体验 1 1 序 毫无疑问,开源开发者圈子来看,2023 年是大模型 LLM 年、生成式 AI GenAI 年。 一、 这自然要从 OpenAI 说起,前一年年底,ChatGPT 的横 空出世,标志着对话式 LLM 开始进入公众视野,为人们 提供了全新的人机交互方式。而 2023 年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 ChatGPT。而 Meta 开源的 Llama 2 更成为了 LLM 领域开源势力的典型代表,它的 出现,犹如一颗投入平静湖面的石子,激荡起层层水波, “Llama 2 一开源,全球范围内进入了百模混战阶段”, 这个说法一点也不为过。 年底的“虚假宣传” Gemini 与“磁力链开源” Mistral 8x7B 两大神作,也凭借不输 GPT-4 的实力,将 LLM 狂 潮卷到天际。 四、 Stable 模型升级、Adobe 产品整合 LLM 能力、 语音模型 whisper-3 更新、AI 虚拟主播创造等,都是在 这条路上的进一步发展。 五、 AI 编程方面,Copilot 可以根据开发者的代码提示自动补 全代码,大大提高了开发效率。这也引发了代码原创性的讨 论,但它已经实实在在将 LLM 拉进了编程应用领域。 六、 LangChain 的出现,实现了 LLM 之间的链式交互,使多 个 LLM0 码力 | 87 页 | 31.99 MB | 1 年前3
2024 中国开源开发者报告编程工具的进化 62 | AI 开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 | 推理中心化:构建未来 推理中心化:构建未来 AI 基础设施的关键 Part 1:中国开源开发者生态数据 04 | Gitee 数据篇 Part 3:国内 GenAI 生态高亮瞬间 104 | 中国 GenAI 消费应用人气榜 Top10 15 | OSS Compass Insight 106 | AI 创新应用开发大赛获奖作品 局长,OSCHINA 副主编 肖滢,OSCHINA 副主编 李泽辰,Gitee 设计:张琪 开发者是开源生态的重要支柱。 本章结合 、 的数据分 析,勾勒 2024 年中国开源开发者的整体画像趋势轮廓,主要 反映中国开源开发者使用开源大模型概况、开源项目/组织健康 度,以及中国开源社区的生态评估等情况。 Gitee 数据篇 本报告数据来源:2024年1月至2024年12月 Gitee及Gitee AI平台相关公开数据 4 / 111 开发者是社区的力量源泉0 码力 | 111 页 | 11.44 MB | 9 月前3
2021 中国开源年度报告年的关键词,应该是“助跑”。迹象已经 非常明显,工信部信息技术发展司发布了《“十四五”软件和信息技 术服务业发展规划》,就是一个典型的信号,开源领域即将起飞了。 从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年, 则是起飞之前的助跑阶段。从地面到天空,意味着整个行为的模式 都会发生深刻的变化。我们原来只需要在一个二维平面思考路径与 方向,而到了天空,在三维空间里,我们多了无数选择。 虽然对于未来,对于在空中的状态,我们还无法预测和把握,但是 ………………………………………………………………………… 19 3.7 开发语言 …………………………………………………………………………………………… 20 3.8 Java 开发框架 ……………………………………………………………………………………… 21 3.9 PHP 开发框架 ……………………………………………………………………………………… 21 3.10 Ruby 开发框架 …………………………………………………………………………………… ………………… 22 3.11 Go 开发框架 ……………………………………………………………………………………… 22 3.12 Node.js 开发框架 ………………………………………………………………………………… 23 3.13 Python 开发框架 ………………………………………………………………………………… 23 3.14 前端开发框架 ……………………………………………………………………………………0 码力 | 132 页 | 14.24 MB | 1 年前3
Moonshot AI 介绍⾼效对⻬⽅法。 ii. 视觉⽅⾯。团队成员发明了MoCo,引爆了基于对⽐学习的视觉预训练范式,也是过去三年 CVPR引⽤量最⾼的⼯作;发明了ShuffleNet,最⾼效的视觉⽹络结构之⼀;主导开发了 detectron2,⼀个被⼴泛使⽤的视觉开源项⽬并被集成到Meta全线VR/AR产品中。 iii. 强化学习⽅⾯。团队成员作为⼀作提出了基于关系学习的少样本⽅法,得到斯坦福⼤学、 Go Google、MIT、Amazon等团队的使⽤和扩展,并获得过OpenAIRL联创及负责⼈John Schulman亲⾃邀请加盟。 iv. 基础设施⽅⾯。团队核⼼成员曾带领数⼗⼈从零开发世界领先的深度学习框架,也具备数千 卡集群全⾃动化硬件运维告警、数百亿特征检索、⼤规模(数⼗PB数据、百万台机器)分 布式系统数量级性能优化的经验。 c. ⽬前团队⼈数超过80⼈,每个⽉都有在全球某个领域有显著影响⼒的⼈加⼊。 所谓的数据⻜轮是很重要的,尽管它是⼀个⽼套的概念。 像ChatGPT这样的产品,还没有完全建⽴起基于⽤⼾数据的持续进化。我觉得这很⼤程度上是base model还在进化,进化了⼀代,之前的⽤⼾数据就没什么⽤了。这跟发展阶段有关系⸺现 在“吃”的是basemodel的scalinglaw,未来可能会去“吃”⽤⼾这个数据源的scalinglaw。 历史上基本所有的互联⽹产品要跑出来,最终都要靠⽤⼾0 码力 | 74 页 | 1.64 MB | 1 年前3
2021 中国开源年度报告年的关键词,应该是“助跑”。迹象已经非常明显,工信部信息技术 发展司发布了《“十四五”软件和信息技术服务业发展规划》,就是一个典型的信号,开源领域 即将起飞了。从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年,则是起飞之 前的助跑阶段。从地面到天空,意味着整个行为的模式都会发生深刻的变化。我们原来只需要 在一个二维平面思考路径与方向,而到了天空,在三维空间里,我们多了无数选择。 For China's / Questionnaire 1、报告背景 / 1 Report Background 2016 年初,开源社发布了《2015 年中国开源社区参会调查报告》,随后的几年中,持续发布 了开发者调查报告,旨在从多种维度呈现国内的开源发展情况。今年我们再次启程,结合数据 分析手段和调查报告等多种形式,绘制一份 2021 年中国开源世界的地图。 In early 2016, KaiYuanShe open source scenarios in 2021. 这份问卷是每年中国开源年报的重要一环,不基于调研的分析报告不过是纸上谈兵。问卷从两 个角度展开,其中包括个人信息(包括工作信息和开发者技术信息)和开源社区参与情况,与 往年不同的是,今年我们加入了开源社区度量和开源商业化相关的话题,欢迎大家参与问卷并 发表自己的想法。 This questionnaire is an essential0 码力 | 199 页 | 9.63 MB | 1 年前3
中国开源软件产业研究报告中国的开源软件法治建设状况 4 中国的开源软件产业发展洞察 4 ——《大教堂与集市》中文版,机械工业出版社 好的软件作品,往往源自于开发者的个人需要——按说这是显而易见的(正如 老话说“需要是发明之母”),但太多的软件开发人员并不需要也不热爱他们 正在开发的软件,他们把编程当差事,为的只是拿薪酬。Linux世界里可不是 这样——也许这可以解释为什么Linux社区里原创软件的平均质量是如此之高。 与世界上绝大多数商品不同,使用一款软件不仅不会损耗它 的价值量,还有可能为之带来增长 开源软件理念的前身是美国计算机软件产业起步之时就在软件开发者群体中流传的“自由软件”理念,彼时这些开发者认 为软件不应该成为一种私有财产,而应该被公开成为公共资源,这样做的好处在于通过让海量的用户对软件进行使用和反 馈来帮助开发者进行产品升级——这是一种只有在软件这样的产品上才能够实现的发展模式;然而,自由软件理念与企业 商业化运营背道而驰 1970s-1998 • 软件开源理念可以追溯到美国的计算 机软件产业初期,彼时一些开发者提 出了“自由软件”的概念,核心理念 是软件不应该成为一种被私有化的商 业资产,而应该成为一种公开、可免 费获得的公共资源,这一理念是后来 的“开源软件”概念的前身 • 1976年美国《著作权法》修订将软件 纳入规制范畴,引起了众多提倡自由 软件的开发者的不满,加速了市场对 开源软件的【战略深化期】 1998-20100 码力 | 68 页 | 3.63 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021量分析等产品。 2020 2021 发布轻舟云原生软件生产力平台、有数全链路数据生产力平台。 网易云品牌升级为网易数帆,发力数字化转型基础软件。 深度参与社区 Spark 3.x 版本开发;开源企业级数据湖探索平台 Kyuubi ;发布首个开源项目分布式存储系统 Curve。 2019 发布全链路数据中台解决方案。 2018 发布轻舟微服务、“瀚海”私有云及国内首款云计算全栈一体机。 网易杭州研究院启动私有云研发,支撑网易集团互联网产品全面上云。 2006 网易成立杭州研究院,构建互联网技术体系。 1997 网易早期云存储产品诞生,支撑网易邮箱运行。 数帆阶段 网易云阶段 前身阶段 数帆历程 04 COMPANY 背靠24 年互联网技术积累 成熟可靠 年 24 140 余项技术专利 140 12 亿终端用户体验支持 亿 12 100 余家行业头部客户 数帆资质(部分) 06 及以前 《Gartner 2020 中国 ICT 技术成熟度曲线》数据中台领域标杆厂商 信通院“大数据'星河'案例-行业大数据应用优秀案例” 信通院 OSCAR 尖峰开源创新(二次开发)奖 云计算开源产业联盟云原生十大优秀案例 infoQ 中国技术力量年度榜单 InfoQ2020 最有价值技术团队 InfoQ2020 最佳技术社区驱动力奖 思否 SegmentFault 中国技术品牌影响力企业0 码力 | 43 页 | 884.64 KB | 1 年前3
2020 中国开源年度报告
⼀⽅⾯,是开源这么多年⼀直持续的上升势头。⽽另⼀⽅⾯,则是我们的⼀个猜测:疫情以 来,越来越多的⼈开始远程办公,事实上促进了更多的⼈有机会“斜杠化”,也就是在⼀台电脑 ⾯前⽅便地切换多种身份,以异步的⽅式处理多种事务,从⽽增加了开发者参与开源的时间和 机会。 当然,同样由于远程办公,虚拟世界在⼈类⽣活中的占⽐,变得更⼤了。这样是否更好,还会 引发哪些问题?作为站在隧道⼝的⼈类,其实是猜不透的。 2. 中国开源崛起以及开源世界分裂的趋势 年中国开源社区参会调查报告》,随后的⼏年中,持续发 布了开发者调查报告,旨在从多种维度呈现国内的开源发展情况。今年我们再次启程,结合数 据分析⼿段和调查报告等多种形式,绘制⼀份 2020 年中国开源世界的地图。 这份问卷是每年中国开源年报的重要⼀环,不基于调研的分析报告不过是纸上谈兵。在往年的 基础上,我们参考了其他现存的主流开发者问卷内容,并加⼊了⼀些新的视⻆。基于 2020年 COVID-19 通过近 60 项左右问题的统计调查与分析,我们希望能够还原出当前中国开源社区的真实现 状,从⽽为开源的后来⼈提供权威的参考。 调查对象:覆盖开发者、社区成员、贡献者、学⽣、政府企业管理⼈员 调查内容:主要涵盖个⼈信息、⼯作状况、开源社区以及开发者技术 调查⽅法:以在线问卷⽅式搜集样本和数据,交叉对⽐法分析数据 推⼴⽅法:线上社交媒体、博客、开源社、开源中国⽹站 问题数量:590 码力 | 46 页 | 4.09 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)Initialization Library(OpenSIL)代 替AMD Generic Encapsulated Software Architecture(AGESA)固件的计划。新固件 将经历四个阶段的开发周期预计到2026年开始 投入使用。 OSM(Open Service Mesh)是一个轻量级、 可扩展的云原生服务网格项目,旨在为运行在 Kubernetes上的应用程序提供简单、完整且独 立 固件协议。 Google、AWS(亚马逊)、Meta(Face- book)、AMI等行业巨头,都是AMD Open- SIL的合作伙伴。 AMD为实现OpenSIL设定了四个阶段的POC (概念验证)评估工作,第一阶段已开始, 兼容Zen4架构的四代霄龙(Genoa),接下 来经过Zen5架构的五代霄龙(Turin),最 终在2026年Zen6架构的六代霄龙上成为默认 值,届时AGESA则会退出。 Kubernetes和IT管理员可以通过制定规则 和限制来管理基础设施,并启用自助式工 作流程。 Mirantis发布轻量级 Kubernetes发行版k0s v1.27 Docker和Kubernetes开发公司Mirantis发布 了其轻量级开源Kubernete发行版的最新版本 k0s。新版本与全新的Kubernetes 1.27版本 兼容,并进行了各种其他改进和错误修复,版 本特性更新如下: •0 码力 | 22 页 | 1.99 MB | 1 年前3
共 12 条
- 1
- 2













