2024 中国开源开发者报告
2030 模型 scaling 最卡脖子的因素。也就是说,在算力到 达瓶颈之前,首先可能会出现电能供应不足甚至交不起电费的问题。因此,算力层可以根据大模 型底层技术的特性,产出针对性的芯片,尤其是加速运算和降低能耗。这是未来 AI 芯片领域的 最优竞争力。 那么,把 transformer“焊死”到板子上就是最佳方案吗?我知道你很急,但你先别急。大 模型底层框架还存在底层路线之争。 32 往 超过开源模型加上一些垂直领域数据微调得到的行业模型。因此,专业模型虽然训练、推理成本 都较高,但考虑到较高的溢价空间,投入是值得的。 由于通用大模型的通用性,难以建立差异化壁垒,也难以形成网络效应,因此基础模型公司 的竞争将非常激烈,算力将成为长期竞争力的关键。 对于大公司而言,能否集中算力、数据和人才,保持组织高效很关键。创业公司需要更多的 资金支持,或者与云计算平台或芯片厂商深 就像今天的基层程序员,需要人表达清楚需求才能做好,复杂系统的架构设计和问题解 决也还是要靠人。 专业模型是通向 AGI 的必经之路。Anthropic CEO 预测,未来 5 年专业模型将达到人类顶 尖专家水平,将人类科研进展加速 10 倍,15 年后人类寿命有望达到 150 岁。但 AGI 能否实现, 最大的不确定性在于技术和资金。 技术方面,一些头部大模型公司已经发现 Transformer 能力“撞墙”,现有高质量语料基0 码力 | 111 页 | 11.44 MB | 8 月前32023 中国开源开发者报告
8x7B 两大神作,也凭借不输 GPT-4 的实力,将 LLM 狂 潮卷到天际。 四、 Stable Diffusion 和 Midjourney 这两大图像生成系统 的出现,极大地拓展和加速了 LLM 在计算机视觉领域的应 用,它们突破了传统图像生成方式的局限,仅需要用户提供 文字描述,就可以生成高质量的数字艺术作品。它们的图像 生成质量、样式多样性和用户便捷性都是极大的突破。这为 2023 年 4 月,陈天奇团队(MLC)发布了一个可将大型语言模型和基于 LLM 的聊天机器人引入 Web 浏览器的项目:Web LLM。一切都在浏览器内运行, 无需服务器支持,并使用 WebGPU 加速。 用 ChatGPT 控制 AI 模型 陈天奇团队发布 Web LLM 用浏览器跑大模型 微软开源 JARVIS(贾维斯) 依托大模型能力,京东云言犀为客户提供涵 盖客户服务、营销导购、多模态数字人等多 提速降价、更多的 API 开放。 2023 年 8 月,谷歌宣布推出 AI 代码编辑器 Project IDX,一个基于浏览器的 开发环境:集成 AI、支持全栈编程语言、跨平台真机预览、一键部署,用于 构建全栈网络和多平台应用程序。 2023 年 10 月,百川智能发布 Baichuan2-192K 大模型,上下文窗口长度高 达 192K,号称是当时全球最长的上下文窗口,能够处理约 35 万个汉字。 在上下0 码力 | 87 页 | 31.99 MB | 1 年前3中国开源软件产业研究报告
是软件不应该成为一种被私有化的商 业资产,而应该成为一种公开、可免 费获得的公共资源,这一理念是后来 的“开源软件”概念的前身 • 1976年美国《著作权法》修订将软件 纳入规制范畴,引起了众多提倡自由 软件的开发者的不满,加速了市场对 开源软件的【战略深化期】 1998-2010 2010至今 • 2010年之前,全球ICT龙头中的部 分企业已经为开源软件产业领域提 供了丰富的经验,例如在1993年成 立的RedHat公司以及在2008年开 但以美国市场为代表,80-90年代期间 软件产业加速发展,其商业价值已经 非常可观。此时市场更需要的是一种 结合自由软件所蕴含的创新性理念与 私有软件的创新性理念与私有软件的 开源软件的【模式探索期】 商业化能力的发展模式,当今 的“开源软件”理念在此时应 运而生 • 1998年,开源组织OSI正式提出 “开源”理念及其十大规范特性, 开源软件产业进入成长期 • 20世纪末互联网经济的加速发展为 开源软件提供了良好的发展环境 数量来构建“质”和“量”互相驱动和促进的良性循环。如果 没有成功的开源运营,软件开源就无法产生显著的商业化效果。 企业实施软件开源战略的商业模型 企业之内 企业之外 软件开源 用户增长 加速创新 产品升级 提供付费订阅版本 提供专业配套服务 引流产生广告收入 直接 商业化 渠道化 为互补产品宣传、导流 提升企业市场声量 产业级影响 促进协同产品出现和创新 构建开源产业基金会0 码力 | 68 页 | 3.63 MB | 1 年前32021 中国开源年度报告
更清晰的研发方向,能致力于开发出更多的功能,并创造出对用户更有价值的产品,避免不必要的开发 成本支出。除此之外,企业可以聘用贡献者来保证开发的活跃性,向开发者提供灵活的工作地点与模式, 提高自身的人才储备来加速产品开发。 图表 5 :开源提高开发人员生产力 资料来源:GitHub 2.2.2 开源软件具有的 Product-Led Growth(PLG)模型特征可以促进付费转化 PLG 模式主要通 78 图表 6 :开源软件增长飞轮 资料来源:云启资本 首先在获客阶段,开源运营模式降低了获客成本,并且使获客流程更具针对性。开发人员的相互交流、 GitHub 等平台带来的社区型协作,加速了传播获客。开源产品的初始客户定位通常为开源社区的参与者, 他们往往是企业里的开发者或者 IT 人员。培育了这些优质潜在客户,也就具备了“群众基础”。社区帮 助打开企业的边界,让好的开源项目和产 3 开源可以带来技术和业务创新的良性循环 只有当技术创新与商业创新相结合时,开源的全部潜力才能实现。Andreessen Horowitz(a16z)分 析指出,开源是一种技术驱动的模式,它可以加速产品反馈和创新、提高软件可靠性、扩展支持、推动 采用并汇集技术人才。然而正是有支持付费、Open Core 和 SaaS 模式等商业模式的出现,才有了现 在的开源发展。经济利益创造了一个良性循环0 码力 | 132 页 | 14.24 MB | 1 年前3国家人工智能产业综合标准化体系建设指南(2024版)
进人工智能赋能新型工业化,特制定本指南。 一、产业发展现状 人工智能是引领新一轮科技革命和产业变革的基础性 和战略性技术,正成为发展新质生产力的重要引擎,加速和 实体经济深度融合,全面赋能新型工业化,深刻改变工业生 产模式和经济发展形态,将对加快建设制造强国、网络强国 和数字中国发挥重要的支撑作用。人工智能产业链包括基础 层、框架层、模型层、应用层等 4 个部分。其中,基础层主 要包括算力、算法和数据,框架层主要是指用于模型开发的 等技术和产 品,应用层主要是指人工智能技术在行业场景的应用。近年 来,我国人工智能产业在技术创新、产品创造和行业应用等 方面实现快速发展,形成庞大市场规模。伴随以大模型为代 2 表的新技术加速迭代,人工智能产业呈现出创新技术群体突 破、行业应用融合发展、国际合作深度协同等新特点,亟需 完善人工智能产业标准体系。 二、总体要求 以习近平新时代中国特色社会主义思想为指导,全面贯 彻 计算设备标准。规范人工智能加速卡、人工智能加速模 组、人工智能服务器等计算设备,及使能软件的技术要求和测试 方法,包括人工智能计算设备虚拟化方法,人工智能加速模组接 口协议和测试方法,及使能软件的访问协议、功能、性能、能效 的测试方法和运行维护要求等标准。 5. 算力中心标准。规范面向人工智能的大规模计算集群、 新型数据中心、智算中心、基础网络通信、算力网络、数据存储 8 等基础设0 码力 | 13 页 | 701.84 KB | 1 年前3【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502
外挂式传统安全手段难以 应对 • 应对模型安全新挑战,打 赢未雨绸缪之战 • 大模型是能力而非产品, 结合场景才能发挥价值 • 中国拥有最完整的产业链、 最全的工业门类、最丰富 的场景 • 发挥场景优势,加速传统 产业数转智改,打赢弯道 超车之战 AGI是全球少数玩家的游戏,政府、企业、创业者更多创新的机会在应用之路 11政企、创业者必读 把大模型拉下神坛! 走入千家万户、百行千业,才能掀起新工业革命 型是对复杂问题 进行规划、分解、预测的能力,实现了真正的慢思考 28 例:课后作业 仔细思考政企、创业者必读 DeepSeek-R1是AI发展史上的重要里程碑 R1形成了新的AGI定律,加速了AGI发展 Alpha Zero时刻 • Alpha Go采用监督学习, 使用人类棋谱训练 • Alpha Zero采用强化学习, 自己跟自己对弈 ChatGPT时刻 • OpenAI ChatGPT大模型, DeepSeek-R1用户体验改善的作用 R1在零广告投入下7天增长1亿用户,创最快应用破亿里程碑 把人工智能从不可用、凑合用,变成大家都能用、都爱用 推动市场加速发展,在中国用户、企业和政府彻底普及了一次AI 中国可能成为全球AI普及率、渗透率最高的国家, 加速了中国爆 发AI产业革命的步伐 DeepSeek颠覆式创新——用户体验 32 ——掀起新一轮AI科普教育 认知决定行动,这场全民AI科普0 码力 | 76 页 | 5.02 MB | 5 月前32021 中国开源年度报告
方向,能致力于开发出更多的功能,并创造出 对用户更有价值的产品,避免不必要的开发成本支出。除此之外,企业可以聘用贡献者来保证 开发的活跃性,向开发者提供灵活的工作地点与模式,提高自身的人才储备来加速产品开发。 Open source brings about rapid product iteration and broadening of user scenarios. The collaborative Flywheel Source: Yunqi Partners 首先在获客阶段,开源运营模式降低了获客成本,并且使获客流程更具针对性。开发人员的相 互交流、GitHub 等平台带来的社区型协作,加速了传播获客。开源产品的初始客户定位通常为 开源社区的参与者,他们往往是企业里的开发者或者 IT 人员。培育了这些优质潜在客户,也就 具备了“群众基础”。社区帮助打开企业的边界,让好的开源项目和产品的口碑传播得以可能。 3 开源可以带来技术和业务创新的良性循环 只有当技术创新与商业创新相结合时,开源的全部潜力才能实现。Andreessen Horowitz(a16z) 分析指出,开源是一种技术驱动的模式,它可以加速产品反馈和创新、提高软件可靠性、扩展 支持、推动采用并汇集技术人才。然而正是有支持付费、Open Core 和 SaaS 模式等商业模式 的出现,才有了现在的开源发展。经济利益创造了一个良性循环。开源的业务创新越多,开发0 码力 | 199 页 | 9.63 MB | 1 年前32023年中国基础软件开源产业研究白皮书
开源帮助操作系统优化性能、提升使用体验:在常见的操作系统开源sig分布中,大量的开发者有序的渗入到不同功能板块的代码仓 中,帮助客户端进一步用好更好的操作系统,同时,sig常见的社区治理类板块,更好的发挥了社区的“网络效应”,实现人才生态 的“源远流长”。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 操 作 系 统 开 源 社 区 常 见 小 组 分 布 操 作 系 统 适 配 生 态 概 www.iresearch.com.cn openEuler 充分发挥社区“网络效应”推动生态良性循环,逐步扩展国际影响 回顾openEuler的发展历程,自开源以后,社区不断完善自身的治理架构。这一举措渐渐吸引了众多厂商加入社区和发布商业发行版。 随后,反哺行为开始出现,捐 绘制。 OpenHarmony架构与应用全景图 一套开发框架支持应用 运行于不同的设备形态 一套架构积木化拼装, 对轻量、小型、标准场 景设备提供系统支持 硬件生态丰富,通用处 理器与各类加速器全覆 盖 将单用户的多种终端整 合为单一虚拟终端 OpenHarmony技术架构 应 用 层 发 行 版 内核层 LiteOS-M LiteOS-A Linux kernel Uniproton0 码力 | 43 页 | 4.69 MB | 1 年前3开源中国 2023 大模型(LLM)技术报告
编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能 力的提升,研究者们开始设计更大规模的神经网络,以提高对语言复杂性的理解。 GPT (Generative Pre-trained Transformer) 的提出标志着 LLM 技术的飞速发展,其预训练和微调的 方法为语言任务提供了前所未有 基础设施:大模型框架及微调 (Fine Tuning) 大模型框架指专门设计用于构建、训练和部署大型机器 学习模型和深度学习模型的软件框架。这些框架提供了 必要的工具和库,使开发者能够更容易地处理大量的数 据、管理巨大的网络参数量,并有效地利用硬件资源。 微调(Fine Tuning)是在大模型框架基础上进行的一个 关键步骤。在模型经过初步的大规模预训练后,微调是 用较小、特定领域的数据集对模型进行后续训练,以使 其 简化了复杂模型的构建过程。这 些 API 抽象掉了许多底层细节,使开发者能 够专注于模型的设计和训练策略。 :这些框架经过优化,以充分利用 GPU、TPU 等高性能计算硬件,以加速模型 的训练和推理过程。 :为了处理大型数据集和大规模参 数网络,这些框架通常设计得易于水平扩展, 支持在多个处理器或多个服务器上并行处理。 :它们提供工具来有效地加 载、处理和迭代大型数据集,这对于训练大 型模型尤为重要。0 码力 | 32 页 | 13.09 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
广东温氏集团食品股份有限公司 广联达科技股份有限公司 广州南天电脑系统有限公司 广州胜鸿电子科技有限公司 广州山水比德科技有限公司 华福证券有限责任公司 华融融通(北京)科技有限公司 华数传媒网络有限公司 华泰证券股份有限公司 华夏银行股份有限公司 杭州东方通信软件技术有限公司 杭州海亮优教教育科技有限公司 杭州睿胜软件有限公司 杭州数澜科技有限公司 杭州网易云音乐科技有限公司 中心,大幅 提升了不同产品线的信息交互效率。轻舟云原生平台使我们统一 了企业信息化标准,降低了运维难度,并提升了平台的稳定性和可 扩展性,改善了用户体验。后续将继续基于轻舟进行共享能力中 心的沉淀,加速前端业务需求的响应速度,构建企业信息化服务 资产体系。 信息科技部 屠经理 大华股份 网易数帆与海亮的合作是基于海亮自身的业务需求出发的,在与 网易的合作中,有数团队根据我们的实际情况,协助制定了数据 丰富的中间件及统一的管控平台,支持 全生命周期的运维操作。 高可用 支持节点、可用区级故障,灵活调度策 略,有效保障数据安全性与可用性。 故障恢复 支持 Node 级和实例级故障自动恢复, 无需人工值守。 异构网络访问 支 持 异 构 协 议 转 换 为 HTTP 协 议 RESTFUL 接口,具备请求转换能力,有 效集成企业存量应用。 基于开源自主可控 基于社区开源版本,进行源码级内核优 化,性能增强,自主可控。0 码力 | 43 页 | 884.64 KB | 1 年前3
共 180 条
- 1
- 2
- 3
- 4
- 5
- 6
- 18