2023 中国开源开发者报告一开源,全球范围内进入了百模混战阶段”, 这个说法一点也不为过。 年底的“虚假宣传” Gemini 与“磁力链开源” Mistral 8x7B 两大神作,也凭借不输 GPT-4 的实力,将 LLM 狂 潮卷到天际。 四、 Stable Diffusion 和 Midjourney 这两大图像生成系统 的出现,极大地拓展和加速了 LLM 在计算机视觉领域的应 用,它们突破了传统图像生成方式的局限,仅需要用户提供 有人称之为“造商业概念”,这里按下不表。 十、 镜头给到国内。相比国际上当前逢 AI 必 GenAI,国内更 多地还是在 LLM 这一层面,Robin Li 的“卷大模型没意 义,卷应用机会更大”,其实很深刻地指出了内中区别。 本报告以开发者视角为主,从 LLM 切入,但实际上或多 或少与 GenAI 脱不开关系。 2023 年国内 LLM 发展活跃,从最初的百度文心一言“硬 刚”ChatGPT,到后来各式各样的大模型与产品出现,覆 日追踪的 9 笔交易来看,生成式 AI 公司 的投前估值中位数已经飙升至 9000 万美元,高于 2022 年的 4250 万美元。PitchBook 的分析师预测,以 32% 的复合年增长率计算,到 2026 年,生成式 AI 市场规模 将达到 981 亿美元。 1 1 由 英 国 知 名 风 投 公 司 Air Street Capital 的 合 伙 人 Nathan Benaich0 码力 | 87 页 | 31.99 MB | 1 年前3
中国开源软件产业研究报告和私有软件的商业性的发展模式,1998年,“开源软件”理念在这一 背景下应运而生。 全球范围内开源软件理念发展历史简述 开源软件的【理念萌芽期】 1970s-1998 • 软件开源理念可以追溯到美国的计算 机软件产业初期,彼时一些开发者提 出了“自由软件”的概念,核心理念 是软件不应该成为一种被私有化的商 业资产,而应该成为一种公开、可免 费获得的公共资源,这一理念是后来 的“开源软件”概念的前身 • 开源代码的源作者/最初贡献 者可能是企业、个人、工作 室等主体,没有任何限制 • 源作者开源软件作品的动机, 可能是企业的战略和市场决 策,也可能是个人的爱好和 对开源产业的支持 • 聚焦到企业为主体的开源行为上来,企业进行开源运营可以选择通过自 身来开展,也可以将项目捐赠给开源基金会,由开源基金会进行直接的 项目运营 • 此处的开源社区指代一个开源项目在运营中所处环境,由不同的开源市 来源:北京软件造价评估技术创联盟(2021),艾瑞咨询研究院根据公开资料研究及绘制。 软件开源的成本效益 估算开源为企业项目节省38%的直接开发成本,其他成本和 收益也应纳入考量 经统计,企业进行软件开发的成本拆解到需求、设计、构建、测试、实施等五个环节后分别占比13%、13%、41%、23% 和10%。其中,开源能够在需求收集整理、软件构建和实施三个环节节省较高比例的成本,在软件设计、测试量个环节也 有一定降本0 码力 | 68 页 | 3.63 MB | 1 年前3
2021 中国开源年度报告年的关键词,应该是“助跑”。迹象已经 非常明显,工信部信息技术发展司发布了《“十四五”软件和信息技 术服务业发展规划》,就是一个典型的信号,开源领域即将起飞了。 从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年, 则是起飞之前的助跑阶段。从地面到天空,意味着整个行为的模式 都会发生深刻的变化。我们原来只需要在一个二维平面思考路径与 方向,而到了天空,在三维空间里,我们多了无数选择。 虽然对于未 转而参与开源项目的原因多为主观原因,例如更好的技能施展空间、更和谐的 社区氛围、更多的朋友,而应公司所在组织的要求来参与开源社区的占比很小。 与去年类似,参与开源的形式仍然为以代码和文档为主,社区和项目正在意识到文档的重 要性,更多开源贡献者投入到了文档撰写中 ; 85% 的开发者认为开源活动对促进和推动开源社区至关重要,相较于去年的 81% 有所提 升。而对于更倾向于线上还是线下的会议,结果竟惊人地持平 岁,受教育程度普遍在本科及以上,其 中男性占比约为 82%,女性为 18%,与去年持平。 20 到 29, 265,50% 20 到 29 30 到 39 40 到 49 50 到 59 60 以上 小于 20 小于 20,108,20% 60 以上 3,1% 50 到 59,7,1% 40 到 49,34,6% 30 到 39,120,22% 参与者年龄分布 参与者性别分布 男 女 男,4410 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告年的关键词,应该是“助跑”。迹象已经非常明显,工信部信息技术 发展司发布了《“十四五”软件和信息技术服务业发展规划》,就是一个典型的信号,开源领域 即将起飞了。从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年,则是起飞之 前的助跑阶段。从地面到天空,意味着整个行为的模式都会发生深刻的变化。我们原来只需要 在一个二维平面思考路径与方向,而到了天空,在三维空间里,我们多了无数选择。 For China's community at the request of the company's organization is minimal. 与去年类似,参与开源的形式仍然为以代码和文档为主,社区和项目正在意识到文档的重 要性,更多开源贡献者投入到了文档撰写中。 Similar to last year, participation in open source continues to be primarily 【专家点评】/ [Expert Comment] 郭悦:开源参与中 43%还未参与工作的学生群体占比最大,这证实了近两年我国开源文化 推广成果,能反映出开源项目的推广已下沉影响到学生群体。不论是 gitee 开源暑期活 动、中科院开源软件点亮计划以及 Google summer of code 等这些来自各个组织公司的 项目都培养了下一代参与开源贡献习惯,了解了开源文化精神和开源协作的共创模式,为0 码力 | 199 页 | 9.63 MB | 1 年前3
Moonshot AI 介绍基于对⽐学习的视觉预训练范式,也是过去三年 CVPR引⽤量最⾼的⼯作;发明了ShuffleNet,最⾼效的视觉⽹络结构之⼀;主导开发了 detectron2,⼀个被⼴泛使⽤的视觉开源项⽬并被集成到Meta全线VR/AR产品中。 iii. 强化学习⽅⾯。团队成员作为⼀作提出了基于关系学习的少样本⽅法,得到斯坦福⼤学、 Google、MIT、Amazon等团队的使⽤和扩展,并获得过OpenAIRL联创及负责⼈John imi智能助⼿中实现“⽆损 ⻓上下⽂窗⼝(LosslessLongContextWindow)”,⽀持20万汉字输⼊,实现对⻓⽂本的⽆ 损记忆。OpenAI和Anthropic到11⽉才在ContextLength上追上来,且在精度(⽆损记忆) 和中⽂能⼒上Kimi智能助⼿依然领先。 b. 聚焦底层技术创新,不⾛技术捷径。最早提出“LosslessLon i智 能助⼿”,电脑上输⼊kimi.ai就能快速进⼊⽹⻚版。之前的名字KimiChat就不再使⽤了。 【功能亮点】 • 智能搜索:搜索实时信息,迅速整合,给出详尽回答,并提供搜集到的信息来源,让对话兼具丰富 性和准确性。 • ⾼效阅读:⻓⽂快速摘要,打破语⾔壁垒,帮你精准理解⽂献书籍、⻓篇报告、复杂合同、⽹⻚⻓ ⽂,提供深⼊洞察和分析。 • 专业解读⽂件:⽆论是⾦融分析0 码力 | 74 页 | 1.64 MB | 1 年前3
2024 中国开源开发者报告大模型撞上“算力墙”,超级应用的探寻之路 36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 大模型训练中的开源数据和算法:机遇及挑战 57 | 2024 年 AI 编程工具的进化 62 | AI 开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 从对中国开源模型崛起的分析,到对开源模型持久性的思考, 再到对超级应用探寻之路的探索,每篇文章都为我们提供了 独特的视角,帮助我们理解开源大模型在 AI 技术领域的作用 和影响。 20 / 111 2024 年中国开源模型:崛起与变革 文/Tiezhen、Adina、Lu Cheng 2024 年,中国在开源人工智能模型领域的崛起和变革成为全球瞩目的焦点:从学术到产业, 从技术到生态,中国通过自 从技术到生态,中国通过自主研发和协同创新,逐步完成了从“追随者”到“引领者”的转变。 这种转变不仅是技术实力的体现,更是中国人工智能生态系统快速完善的真实写照。以下,我们 将从崛起与变革两个维度,探讨中国开源模型在这一年取得的重大成就和未来展望。 崛起 从“追随者”到“引领者” 2024 年,中国学术界和产业界大力推进自主研发,在技术创新和模型能力上实现了显著飞 跃,并在全球范围内取得了显著成就。 Hugging0 码力 | 111 页 | 11.44 MB | 9 月前3
2020 中国开源年度报告
渐变成现实。 如果中国的开源,以⼀种与世界隔离的⽅式 “崛起”,这并不是我们希望看到的未来。 3. 开源向善以及我们尚未做好准备 疫情爆发以来,众多的开源⼈奉献⾃⼰的时间、精⼒、技术和智慧,投⼊到⼀个⼀个的抗疫相 关的开源项⽬之中,也因此诞⽣了诸多⾯向医学、防疫、公益、救援的开源组织和开源项⽬。 其中 wuhan2020 就是典型的代表。 因此,在 2020 年的中国开源年会筹办期间,我们毫不犹豫的选择了 研的分析报告不过是纸上谈兵。在往年的 基础上,我们参考了其他现存的主流开发者问卷内容,并加⼊了⼀些新的视⻆。基于 2020年 COVID-19 这个不容忽视的⼤背景,这份调查问卷进⼀步将视⻆发散到开源世界的线上协 作,以及开源能够为世界带来什么等主题。 通过近 60 项左右问题的统计调查与分析,我们希望能够还原出当前中国开源社区的真实现 状,从⽽为开源的后来⼈提供权威的参考。 调查 推⼴⽅法:线上社交媒体、博客、开源社、开源中国⽹站 问题数量:59 问题类型:单选、多选、开放性 样本量:236 2、重要发现 由于疫情,今年的问卷全部通过线上的⽅式传播,因此收集到的样本量相⽐往年较少,但仍旧 能够管中窥豹,观察到中国开源世界的悄然变化。通过分析 2020 年的统计数据,并对⽐往年 数据和其它⼀些公开发布的统计报告,我们有如下⼀些重要发现: 开源参与者的主⼒依旧是 20-390 码力 | 46 页 | 4.09 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书从世界角度看中国开源产业增长 32% 16% 12% 7% 7% 26% 印度 中国 巴西 俄罗斯 印度尼西亚 其他国家 GitHub2022年各国新增贡献者占比(不包含美国) Github认为,到2025年,美国开源贡献者的比例会由2015年 30.4%下降并稳定在16.4%,而中国开源贡献者的比例预计将 达到13.3%,同时期预估其他贡献率强劲的国家数据分别是印 度(7.9%)、巴西(3%)、尼日利亚(1 基础软件的开源发起者一般为企业级开发者,对于他们来讲,开源项目从设立、运营到最终成熟是一个长期的过程。不同于传统项 目具有明确、可量化的ROI,开源项目为企业带来的多为无法直接变现的间接性收益,但这类收益却是支撑企业长期走稳走强的底层 动力。我们看到,市场中一些开源项目因一段时间后仍无法看到明确的项目回报而以失败告终,逐渐被开源发起者抛弃。正因如此, 企业应转变短视思路,认识到开源是一种长期行为,对应制定长期战略。仅以投入产 开源项目需要企业内多组织的共同投入,开源项目的良好运营也需要不同组织间的通力协作。我国较大规模的开源企业发起者,每 年投入开源项目的资金量达到10亿元级别,同时企业从包含技术、产品、运营、战略、职能各部门组织超过千人的团队,投入到开 源项目的治理。近年来,越来越多的企业选择在内部设立开源部门/开源办公室(OSPO)/开源委员会,统筹沟通企业开源人员,协 调开源资源分配,体现了企业对于开源战略及运营重视高度的提升。 来源:根据0 码力 | 43 页 | 4.69 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)Initialization Library(OpenSIL)代 替AMD Generic Encapsulated Software Architecture(AGESA)固件的计划。新固件 将经历四个阶段的开发周期预计到2026年开始 投入使用。 OSM(Open Service Mesh)是一个轻量级、 可扩展的云原生服务网格项目,旨在为运行在 Kubernetes上的应用程序提供简单、完整且独 立的服务网格解决方案,包括处理在Kuberne- Kubernetes。具体 功能如下: • NDK为Kubernetes应用提供数据保护、 恢复、迁移、克隆和复制等管理功能; • 支持将恢复时间目标(RTO)和恢复点目 标(RPO)从几天缩短到几分钟; • 提供策略驱动的有状态应用管理; • Kubernetes和IT管理员可以通过制定规则 和限制来管理基础设施,并启用自助式工 作流程。 Mirantis发布轻量级 Kubernetes发行版k0s 域名配置https证书时,增加搜索功能或优 先匹配与域名相同的证书; • 支持配置日志存储路径。 近日,Prometheus v2.44.0发布,版本特性更 新如下: • 将每次发送的默认样本数提高到2000; • 支持处理原生直方图数据; • 在命令行中添加用于检查Prometheus服务 器健康状态和可用性的功能; • 添加所有查询加载的样本总数指标。 OpenYurt v1.3.0发布0 码力 | 22 页 | 1.99 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021TensorFlow 等主流计算框架,支持自 定义镜像、支持模型及服务标准化。 便捷易用 模型开发、训练、调度可视化管控,内置 100+算子,支持模型一键式部署,降低 AI建模门槛。 AutoML 支持端到端 AutoML,自动化完成特征 治理、参数寻优、模型筛选流程,智能化 加速数据价值产出。 全流程管控 一站式覆盖数据导入、特征治理、模型 开发、模型训练、推理服务建模全流程, 提升 AI 建模效率。 模型/数据市场 数据源管理 专家开发环境 Jupyter交互式 建模 Jupyter模型 市场 训练服务 训练可视化 作业管理 自定义算子 服务管理 SOLUTIONS 为金融行业提供端到端数据服务能力,致力于帮助金融机构加快自身数字化进程,打造数字化金融服务,实现业务 在线、渠道开放、金融智能、生态融合、架构敏捷与数据服务化。 金融大数据解决方案 28 方案价值 方案架构 方案特色 快速响应风控、营销、运营等场景需求 集团算法模型资产统一管理、自主可控 客户需求: 避免严重资源浪费 降低高成本维护 提高交付效率 解决方案: 建设分布式体系基础中间件支撑平台 提供全行统一的基础中间件交付 端到端覆盖基本管理和高级运维场景 客户收益: 基础技术能力服务化 大幅提升应用交付效率 提升应用大规模扩展能力 首批股份制商业银行之一。 兴业银行 12 家全国性股份制商业银行之一。 浙商银行 CASE0 码力 | 43 页 | 884.64 KB | 1 年前3
共 18 条
- 1
- 2













