2023 中国开源开发者报告
论,但它已经实实在在将 LLM 拉进了编程应用领域。 六、 LangChain 的出现,实现了 LLM 之间的链式交互,使多 个 LLM 模型串联工作,发挥各自的优势,并且可以将 LLM 模型与外部数据源进行连接,产生更强大的语言理解 和生成效果。这开启了 LLM 集成应用的新方向,并诞生了 一个新的细分领域“LLMOps”。 七、 “提示词工程”,这是 LLM 直接催生出来的新“学科”, 大模型、上海人工智能实验室的书生通用大模型、腾 讯的混元大模型、蚂蚁的百灵大模型等。 另一方面,除了大模型本身,中国在 LLM 相关技术领域也 快速迭代发展,诸如 Dify.AI 的 LLMOps、Milvus 的向量 数据库、CodeGeeX 与 Comate 的 AI 编程、对 LLM Prompt 的研究、OneFlow 的深度学习框架。 值得一提的还有华为的盘古大模型,其中盘古气象大模型是 首个精度超过传统数值预报方法的 Yi-34B 在 Hugging Face 英文测试榜单中位 列第一,在 C-Eval 中文能力排行榜中超越所有开源模型。 十一、 这一小节,通过一些数据来简要概述 2023 年的 LLM、 GenAI。根据金融数据和软件公司 PitchBook 的数据,从 截至 3 月 29 日追踪的 9 笔交易来看,生成式 AI 公司 的投前估值中位数已经飙升至 9000 万美元,高于 2022 年的 42500 码力 | 87 页 | 31.99 MB | 1 年前32020 中国开源年度报告
”新冠疫情与中美贸易战,在同⼀年加剧。⽽因 为疫情和贸易战,世界正在加速发⽣变化。 在这样的历史⼤背景下,我们在开源界,也发现了以下三个趋势: 1. 开源⼤发展以及由实向虚进发的趋势 从各种数据,以及我们⾃⼰的感觉都能发现:全球开源都出现⼀个⼤发展的趋势。GitHub 的 活跃代码仓库与活跃⽤户数在⾼速增⻓(35.3% / 21.2%);Gitee 的代码仓库与⽤户数在以 更加惊⼈的速度增⻓(192% 的超⾼速增⻓,CODE China 的新发布,我们已经可以确信,2020 年是中国开源的崛 起之年。接下来阅读报告的朋友们,应该会看到很多确切的证据。 但是,另⼀个值得注意的现象,也可以从下⾯的数据⾥看出来。在 GitHub 上最活跃的中国开 源项⽬,与 Gitee 上最活跃的开源项⽬之间,完全没有重叠。 随着 Gitee 的继续⾼速发展,可以⼤胆预测,今后会有越来越多的,⾼质量的中国开源项 调查⽅法:以在线问卷⽅式搜集样本和数据,交叉对⽐法分析数据 推⼴⽅法:线上社交媒体、博客、开源社、开源中国⽹站 问题数量:59 问题类型:单选、多选、开放性 样本量:236 2、重要发现 由于疫情,今年的问卷全部通过线上的⽅式传播,因此收集到的样本量相⽐往年较少,但仍旧 能够管中窥豹,观察到中国开源世界的悄然变化。通过分析 2020 年的统计数据,并对⽐往年 数据和其它⼀些公开发布的统计报告,我们有如下⼀些重要发现:0 码力 | 46 页 | 4.09 MB | 1 年前32024 中国开源开发者报告
大模型撞上“算力墙”,超级应用的探寻之路 36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 大模型训练中的开源数据和算法:机遇及挑战 57 | 2024 年 AI 编程工具的进化 62 | AI 开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 AI 应用的核心架构 68 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 | 推理中心化:构建未来 AI 基础设施的关键 Part 1:中国开源开发者生态数据 04 | Gitee 数据篇 Part 3:国内 GenAI 生态高亮瞬间 104 | 中国 GenAI 消费应用人气榜 Top10 15 | OSS Compass Insight 106 | AI 创新应用开发大赛获奖作品 设计:张琪 开发者是开源生态的重要支柱。 本章结合 、 的数据分 析,勾勒 2024 年中国开源开发者的整体画像趋势轮廓,主要 反映中国开源开发者使用开源大模型概况、开源项目/组织健康 度,以及中国开源社区的生态评估等情况。 Gitee 数据篇 本报告数据来源:2024年1月至2024年12月 Gitee及Gitee AI平台相关公开数据 4 / 111 开发者是社区的力量源泉 2000 码力 | 111 页 | 11.44 MB | 8 月前3网易数帆 领先的数字化转型技术与服务提供商 2021
领先的数字化转型技术与服务提供商 网易数帆是网易集团旗下 TO B 企业服务品牌,定位于领先的数字化转型 技术与服务提供商,为客户提供创新、可靠的国产软件基础平台产品及相 应技术服务,业务覆盖云原生基础软件、数据智能全链路产品、人工智能 算法应用三大领域,旗下拥有轻舟、有数、易智三大产品线,致力于帮助 客户搭建无绑定、高兼容、自主可控的创新基础平台架构,快速应对新一 代信息技术下实现数字化转型的需求。 等诸多大中型客户。 以“开放、开源、跨云”为技术理念,网易数帆大力推动技术研究,先后取 得“工信部云计算服务能力标准首批试点单位”、“国家企业技术中心”、“信 通院云计算标准和开源推进委员会成员”、“信通院大数据技术标准推进委 员会成员”、“信创工委会成员”等机构资质。同时,网易数帆积极推动跨厂 商的数字化技术融合发展,与AWS、阿里云、百度云、华为鲲鹏云计算、 浪潮、新华三等多家企业完成技术兼容性认证。 数帆历程 关于数帆 数帆实力 荣誉资质 客户名录 客户口碑 业务全景 产品篇 网易有数 网易轻舟 网易易智 客户案例篇 解决方案篇 数据中台解决方案 业务中台解决方案 金融分布式解决方案 金融大数据解决方案 零售大数据解决方案 零售行业 金融行业 制造行业 综合行业 02 03 04 02 01 04 05 06 08 09 10 120 码力 | 43 页 | 884.64 KB | 1 年前32023年中国基础软件开源产业研究白皮书
www.iresearch.com.cn 基础软件开源界限划分 操作系统、数据库、中间件、AI框架底层代码按规范进行共享与协作 本篇报告研究的基础软件开源范围,是指研究“开源”中“基础软件”板块的情况。开源过程中,参与者可以共享、协作完成开发, 正好与基础软件庞大的开发量需 ,其意义惠及软件产业全领域。 注释:由于暂无国内厂商主导的开源编程语言,因而不列入本报告研究范围。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 对于这四类基础软件(操作系统、数据库、AI框架、中间件),其编写者将实现功能的代码按照一定的开源规范 开放,任何人可以查看、使用、贡献,同时,使用者也要遵循一定的开源规范。 基础软件开源范畴界定 国内基础软件开源界定 基础软件 杂等特点 中间件:不同系统和应用程序之间交互 与协作的桥梁 AI框架:具备构建和部署人工智能模型 的基础的全套开发工具 操作系统:是软硬件资源的资源管理者, 为用户与应用程序提供交互接口 数据库:通过对数据的访问与管理,支 持各种应用程序和业务的需求 编程语言:人与计算机交互的“语言”, 含编译器、基础编程语言、IED等 社区协作:鼓励各方在开放平台上协作 贡献,推动开源内容的发展 创新改进:通过资源共享与协作共生,0 码力 | 43 页 | 4.69 MB | 1 年前3Moonshot AI 介绍
hn Schulman亲⾃邀请加盟。 iv. 基础设施⽅⾯。团队核⼼成员曾带领数⼗⼈从零开发世界领先的深度学习框架,也具备数千 卡集群全⾃动化硬件运维告警、数百亿特征检索、⼤规模(数⼗PB数据、百万台机器)分 布式系统数量级性能优化的经验。 c. ⽬前团队⼈数超过80⼈,每个⽉都有在全球某个领域有显著影响⼒的⼈加⼊。 2.团队聚焦底层技术创新,技术Vision强 a. 忆) 和中⽂能⼒上Kimi智能助⼿依然领先。 b. 聚焦底层技术创新,不⾛技术捷径。最早提出“LosslessLongContext可以解决90%以上的 模型定制问题”,坚持对数据的⽆损压缩,实现模型能⼒的提升,不⾛技术捷径(通过滑动窗 ⼝、降采样、⼩模型等技术实现上下⽂窗⼝延⻓,都是“技术捷径”) c. 通过这篇⽂章,您可以了解更多技术⽅⾯信息:专访⽉之暗⾯杨植麟:l 3.Kimi智能助⼿的中⽂实⼒强、增⻓速度快、⼝碑好 a. 在投资机构和⼤⼚的内部综合评测中,Kimi智能助⼿的中⽂实⼒直追OpenAI。 b. 根据“AI产品榜aicpb.com”的统计数据,2024年1⽉Kimi智能助⼿的访问量142万,在⼤模型 创业公司的“AIChatBots”产品中排在第⼀;⽉环⽐增⻓率94.1%,增⻓速度也在⼤模型创业 公司的第⼀位。 “Kimi智能助⼿”详细介绍0 码力 | 74 页 | 1.64 MB | 1 年前32021 中国开源年度报告
Python 开发框架 ………………………………………………………………………………… 23 3.14 前端开发框架 …………………………………………………………………………………… 24 3.15 数据库……………………………………………………………………………………………… 25 3.16 版本控制工具 …………………………………………………………………………………… 26 3.17 AI 开发框架 ……………………………………………………………………………… 44 5 总结 & 致谢 ………………………………………………………………………………… 45 2021 中国开源年度报告数据篇 …………………………………………… 47 GitHub 数据 …………………………………………………………………………………… 48 活跃度公式 ……………………………………………………………………………………… 48 1 世界活跃度排名 Top10 …………………………………………………………………… 48 2 中国活跃度排名 Top30 …………………………………………………………………… 50 3 中国企业开源数据分析(按活跃度排序) ………………………………………………… 54 4 Apache 基金会中国项目活跃度分析 Top20 …………………………………………… 56 5 CNCF 中国项目活跃度分析0 码力 | 132 页 | 14.24 MB | 1 年前3全球开源发展态势洞察(2023年第八期)
AMD正计划使用开源的OpenSIL代替AGESA 开放服务网格OSM(Open Service Mesh)项目已停止维护 KSOC推出业内首个实时Kubernetes安全态势管理平台 Nutanix推出Kubernetes数据管理平台 Nutanix Data Services for Kubernetes Mirantis发布轻量级Kubernetes发行版k0s v1.27 Azure AKS正式推出网络方案Azure 01 行业发展 Nutanix推出Kubernetes 数据管理平台Nutanix Data Services for Kubernetes 近日,Nutanix推出Kubernetes数据管理平台 Nutanix Data Services for Kubernetes。具体 功能如下: • NDK为Kubernetes应用提供数据保护、 恢复、迁移、克隆和复制等管理功能; • 支持将恢复时间目标(RTO)和恢复点目 域名配置https证书时,增加搜索功能或优 先匹配与域名相同的证书; • 支持配置日志存储路径。 近日,Prometheus v2.44.0发布,版本特性更 新如下: • 将每次发送的默认样本数提高到2000; • 支持处理原生直方图数据; • 在命令行中添加用于检查Prometheus服务 器健康状态和可用性的功能; • 添加所有查询加载的样本总数指标。 OpenYurt v1.3.0发布 OpenYurt是由阿里云开源的基于原生Kuberne-0 码力 | 22 页 | 1.99 MB | 1 年前32021 中国开源年度报告
Background 2016 年初,开源社发布了《2015 年中国开源社区参会调查报告》,随后的几年中,持续发布 了开发者调查报告,旨在从多种维度呈现国内的开源发展情况。今年我们再次启程,结合数据 分析手段和调查报告等多种形式,绘制一份 2021 年中国开源世界的地图。 In early 2016, KaiYuanShe released the 2015 China Open Source information, work status, open source community, and developer technology 调查方法 :以在线问卷方式搜集样本和数据,交叉对比法分析数据 Survey method: Online questionnaire to collect samples and data, cross-comparison method to analyze choices, open 样本量 :537 Sample size: 537 2、重要发现 / 2 Important Findings 通过分析 2021 年的统计数据,并对比往年数据和其它一些公开发布的统计报告,我们有如下 一些重要发现: By analyzing the statistics for 2021 and comparing previous years'0 码力 | 199 页 | 9.63 MB | 1 年前3中国开源软件产业研究报告
供了丰富的经验,例如在1993年成 立的RedHat公司以及在2008年开 源的谷歌Chromium浏览器内核架 构,本报告后文将有进一步介绍。 2010年之后互联网经济进入蓬勃发 展期,云计算、大数据计算、AI等 新兴技术的发展越来越多地开始基 于开源技术,开源对于企业打磨产 品、构建生态的战略意义也开始突 显 一种开放、非私有的软件开发 和运营方式的探索 • 但以美国市场为代表,80-90年代期间 商业化 渠道化 为互补产品宣传、导流 提升企业市场声量 产业级影响 促进协同产品出现和创新 构建开源产业基金会 e.g. Linux发行版 e.g. Google浏览器 e.g. 开源数据库托管 产 业 协 同 软件开源核心运营 e.g. Kubernetes 11 ©2022.2 iResearch Inc 开源是软件市场“后进者”扩大市场影响力的重要手段 从市场竞争战略的视角上看,软件开源通常是软件市场的“后进者”扩大市场影响力、追赶头部企业的重要手段。观察PC 操作系统、移动操作系统、DBMS(核心数据库)三大类典型基础软件产品的开源/闭源情况,整体来看后出现的软件产品 更有可能是开源的,这一情况在DBMS情况尤为显著。通过开源,新的产品能够能更快地打入市场,开放的源代码也更容 易获得顾客的信任和0 码力 | 68 页 | 3.63 MB | 1 年前3
共 12 条
- 1
- 2