2023 中国开源开发者报告说起,前一年年底,ChatGPT 的横 空出世,标志着对话式 LLM 开始进入公众视野,为人们 提供了全新的人机交互方式。而 2023 年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 的台阶,为 LLM 的广泛应用奠定了基础。再之后的 11 月份,OpenAI 再发力,GPTs 的到来,“用户自定义 ChatGPT”的能力,更是让世人领略了 OpenAI 作为 LLM 一哥的宏大叙事能力与强劲技术实力。 模型串联工作,发挥各自的优势,并且可以将 LLM 模型与外部数据源进行连接,产生更强大的语言理解 和生成效果。这开启了 LLM 集成应用的新方向,并诞生了 一个新的细分领域“LLMOps”。 七、 “提示词工程”,这是 LLM 直接催生出来的新“学科”, 它的核心在于研究人类如何与 LLM 更好地进行“沟通”, 找到让 LLM 能够准确理解人类意图的方法。提示词工程探 索如何以 LLM 可以解析的方式来表达需要它完成的任务, Agent 为中心的智能 化模式。LLM Agent 打破了传统 LLM 的被动性,使 LLM 能够主动学习和执行任务,从而提高了 LLM 的应用 范围和价值;它为 LLM 的智能化发展提供了新的方向, 使 LLM 能够更加接近于人类智能。 九、 AI 原生,目前还没有明确的定义,大致是说,不同于当前 各种应用在原本的基础上增加 AI 能力,使其智能化,但 它的智能只充当了“辅助”角色;在0 码力 | 87 页 | 31.99 MB | 1 年前3
 全球开源发展态势洞察(2023年第八期)Silicon Initialization Library(OpenSIL)代 替AMD Generic Encapsulated Software Architecture(AGESA)固件的计划。新固件 将经历四个阶段的开发周期预计到2026年开始 投入使用。 OSM(Open Service Mesh)是一个轻量级、 可扩展的云原生服务网格项目,旨在为运行在 Kubernetes上的应用程序提供简单、完整且独 管理。OSM于2020年8月推出,同年加入云原 生计算基金会(CNCF)。不久后,该项目成为 云原生计算基金会(CNCF)沙箱级别的项目。 2022年初,OSM正式发布v1.0.0版本。 近日,OSM维护团队宣布OSM不再发布新的 版本,团队将转向与Istio社区共同合作,来推 进Istio的发展。此外,OSM向云原生计算基 金会(CNCF)申请进行项目归档,目前还未 真正执行。 KSOC推出业内首个实时 Kubernetes安全态势管理平台 Docker和Kubernetes开发公司Mirantis发布 了其轻量级开源Kubernete发行版的最新版本 k0s。新版本与全新的Kubernetes 1.27版本 兼容,并进行了各种其他改进和错误修复,版 本特性更新如下: • 兼容Kubernetes1.27; • 支持容器插件,如WebAssembly(WASM) 和gVisor容器沙箱; • k0s将用自建的镜像来运行所有的系统组件; • 支持控制Helm0 码力 | 22 页 | 1.99 MB | 1 年前3
 2024 中国开源开发者报告源生态的发展产生了积极的影响,为全球开发者提供了更多创新和应用的可能。 中国开源模型从最初的质疑中崛起,逐步赢得了广泛认可。这不仅彰显了中国开源模型从追 随者到行业引领者的跨越式成长,也为全球人工智能发展注入了新的活力与动力。中国开源模型 的成功并非偶然。在政府对人工智能产业的持续支持以及国内人工智能行业对模型研发的巨额投 入下,从基础算法到行业应用、从算力基础设施到数据资源整合,中国人工智能生态体系正在迅 软件为起点,用户/开发者 运营为途径的软件产品推广策略。 我的观点是,开源策略是大模型最好的竞争策略。接下来让我们从头捋一捋推导过程。 我们先看大模型赛道的整体状况:  大模型是一项相对较新的技术。尽管 OpenAI 早在 2019 年就发布了第一个重要的 模型 GPT-2,但大模型的广受关注实际始于 2022 年 11 月发布的 ChatGPT。8 个月以后 Meta 就与微软合作发布了开源大模型 根据报告【1】,能源消耗将会是 2030 模型 scaling 最卡脖子的因素。也就是说,在算力到 达瓶颈之前,首先可能会出现电能供应不足甚至交不起电费的问题。因此,算力层可以根据大模 型底层技术的特性,产出针对性的芯片,尤其是加速运算和降低能耗。这是未来 AI 芯片领域的 最优竞争力。 那么,把 transformer“焊死”到板子上就是最佳方案吗?我知道你很急,但你先别急。大 模型底层框架还存在底层路线之争。0 码力 | 111 页 | 11.44 MB | 8 月前3
 中国开源软件产业研究报告结合自由软件所蕴含的创新性理念与 私有软件的创新性理念与私有软件的 开源软件的【模式探索期】 商业化能力的发展模式,当今 的“开源软件”理念在此时应 运而生 • 1998年,开源组织OSI正式提出 “开源”理念及其十大规范特性, 开源软件产业进入成长期 • 20世纪末互联网经济的加速发展为 开源软件提供了良好的发展环境 7 ©2022.2 iResearch Inc 企业的重要手段。观察PC 操作系统、移动操作系统、DBMS(核心数据库)三大类典型基础软件产品的开源/闭源情况,整体来看后出现的软件产品 更有可能是开源的,这一情况在DBMS情况尤为显著。通过开源,新的产品能够能更快地打入市场,开放的源代码也更容 易获得顾客的信任和了解;在市场中的既有竞品是闭源软件的情况下,开源的基础软件更容易建立上层生态,从而从生态 而非软件本身来构建市场壁垒,帮助实现对既有产 www.iresearch.com.cn 来源:中国信通院,新思科技《2020年开源安全与风险分析报告》 ,艾瑞咨询研究院根据公开资料研究及绘制。 企业开源的战略意义(二) 开源在企业中的使用率提升,带来多维度战略价值 除前文所述的商业价值和成本优化之外,0 码力 | 68 页 | 3.63 MB | 1 年前3
 2023年中国基础软件开源产业研究白皮书编程语言:人与计算机交互的“语言”, 含编译器、基础编程语言、IED等 社区协作:鼓励各方在开放平台上协作 贡献,推动开源内容的发展 创新改进:通过资源共享与协作共生, 提升开源内容质量,并产生新的内容 自由共享:开源内容可以免费被任何人 查看、学习、使用 透明与可审查:开源的源代码可以被任 何人审查验证、保持质量 开源精神 通过传递一种对于知 识分享、知识透明和 平等合作的价值观, 凝聚群众力量,促进 5%)。  Github2025年开源贡献者比例预估(按国别分) 从国内角度看中国开源现状  Gitee2022年平台上开源指标的变化 平台仓库 2500万 新增用户 200万 新仓库 480万 总用户 1000万  CSDN2023年调研:使用开源软件的开发者比例 64% 32% 2% 2% 经常使用 偶尔使用 不清楚 从未使用 42% 49% 2022 选择适合开源项目的开源协 议,依据企业对项目的开源 方案审定协议中个别条款 向上对接高校及研究机构, 加紧基础技术共建;向下对 应发行版ISV厂商,将软件向 更多行业及场景渗透 规划开源软件迭代方向,包 括但不限于软件特性增加、 现有功能增强、Bug修补, 并提出相应的合格指标 一方面积极对社区开发者的回 复给予反馈,另一方面发掘优 秀的灵感,增强创新能力 对开发者提交的代码进行评 审,确保代码的可读性和可 维护性,及时做出缺陷反馈0 码力 | 43 页 | 4.69 MB | 1 年前3
 2020 中国开源年度报告
在⼼⾥升起的⼀句话 是:“这是最好的时代,这是最坏的时代”。 也许多年以后,我们回看 2020 年,会将其称之为:世界剧变之始。很多朋友在去年,甚 ⾄“每⼀天都在亲历历史,每⼀天都是活久⻅!”新冠疫情与中美贸易战,在同⼀年加剧。⽽因 为疫情和贸易战,世界正在加速发⽣变化。 在这样的历史⼤背景下,我们在开源界,也发现了以下三个趋势: 1. 开源⼤发展以及由实向虚进发的趋势 从各种数据, 据分析⼿段和调查报告等多种形式,绘制⼀份 2020 年中国开源世界的地图。 这份问卷是每年中国开源年报的重要⼀环,不基于调研的分析报告不过是纸上谈兵。在往年的 基础上,我们参考了其他现存的主流开发者问卷内容,并加⼊了⼀些新的视⻆。基于 2020年 COVID-19 这个不容忽视的⼤背景,这份调查问卷进⼀步将视⻆发散到开源世界的线上协 作,以及开源能够为世界带来什么等主题。 通过近 60 项左右问题的统计调查与分析 有⼀种类似⼤家庭的凝聚⼒。 ⼗⼏年前的开源圈⼦, 活跃于 ⼀⼩群早期的开源⼈之间。我观察到身边的开源⼈⼠⼤多数都是超过 10年以上的,并且未来 也会持续投⼊开源。 2020 年数据显示有 3 成新参与者,从另外⼀个⻆度也印证了开源运动 在发展多年之后,呈现出⼀种出圈的状态。 4.2 在开源中的时间投⼊ 约有 44% 的参与者每周在开源上的时间投⼊不⾜ 5 ⼩时,每周对开源投⼊时间在 5-20个⼩0 码力 | 46 页 | 4.09 MB | 1 年前3
 2021 中国开源年度报告六、开源新创投资持续发光发热 ………………………………………………………………………… 117 七、开源操作系统迎来新一轮繁荣期 …………………………………………………………………… 117 八、Rust 迈上新征程 …………………………………………………………………………………… 117 九、AI & 低代码将会如何改变开源,值得关注 ……………………………………………………… 117 十、开源硬件持续升温,RISC-V 六、开源新创投资持续发光发热 ………………………………………………………………………… 126 七、开源操作系统迎来新一轮繁荣期 …………………………………………………………………… 127 八、Rust 迈上新征程 …………………………………………………………………………………… 128 九、AI & 低代码将会如何改变开源,值得关注 ……………………………………………………… 129 十、开源硬件持续升温,RISC-V 术指标上的优势。客观来看,这对开源的发 展有利有弊。利的一面在于,技术产品的提供方,在相关的开源领域的贡献可以被视为技术竞争力;弊的一面 在于让部分厂商为了取得差异化的竞争优势,把本应开源出来的特性或者优化,来闭源处理,从而不利于开放 式创新,也降低了可维护性。更为健康的针对开源产品的采购模式,应该平衡产品指标,技术竞争力以及产品 本身的可维护性。 段夕华:不知道 21 年底所爆发的 log4j0 码力 | 132 页 | 14.24 MB | 1 年前3
 网易数帆 领先的数字化转型技术与服务提供商 2021应技术服务,业务覆盖云原生基础软件、数据智能全链路产品、人工智能 算法应用三大领域,旗下拥有轻舟、有数、易智三大产品线,致力于帮助 客户搭建无绑定、高兼容、自主可控的创新基础平台架构,快速应对新一 代信息技术下实现数字化转型的需求。 网易数帆依托网易二十余年互联网技术积累,系列软件基础平台产品和技 术方案,成熟应用于金融、零售、制造、能源、电信、物流等多个行业领 域,在技术先进性、 2020 2019 2018 HONOR 数帆荣誉 07 (部分) 北京嗨学网教育科技股份有限公司 北京卡车之家信息技术股份有限公司 北京世纪好未来教育科技有限公司 北京新唐思创教育科技有限公司 北京直客通科技有限公司 北京自如信息科技有限公司 博时基金管理有限公司 百胜咨询(上海)有限公司 八维通科技有限公司 成都南博教育咨询有限公司 成都四方伟业股份有限公司 服务治理 服务路由 流量染色 服务化 将企业能力转化为数字化的 服务,打破企业软件应用中数 据孤岛等现状。 敏捷 通过小步快跑的方式敏捷迭 代,不断适应市场与业务需求 的变化,摆脱缓慢的大版本更 新与业务需求脱节的窘境。 高效 通过自动化与生产协作方式 的优化,多环节提升软件生产 的效率。 开放 基于开放的技术体系,打造开 放的软件架构。 轻舟云原生软件生产力平台 2.0 能力全景图0 码力 | 43 页 | 884.64 KB | 1 年前3
 2021 中国开源年度报告指标上的优势。客观来看,这对开源的发展有利有弊。利的一面在于,技术产品的提供 方,在相关的开源领域的贡献可以被视为技术竞争力;弊的一面在于让部分厂商为了取得 差异化的竞争优势,把本应开源出来的特性或者优化,来闭源处理,从而不利于开放式创 新,也降低了可维护性。更为健康的针对开源产品的采购模式,应该平衡产品指标,技术 竞争力以及产品本身的可维护性。 Du Junping: Due to the rapid development the value of open source activities than last year. 【专家点评】/ [Expert Comment] 段夕华:线下占比接近一半是跟新冠疫情持续有关系,还是真进入了 Cyber 生存时代? Duan Xihua: Is nearly half of the offline share related to the ongoing China Open Source Annual Report - Commercialisation 1. 概述 Overview 1998 年开源(Open Source)一词诞生,这种新提法的出现很大程度上是为了消除人们对于自 由软件(Free Software)中 “Free”的模糊理解,使其更加商业友好。可以说开源软件从诞 生之初,就和商业化之间并无矛盾,开源不等于免费。近年来,随着一些开源公司在资本市场0 码力 | 199 页 | 9.63 MB | 1 年前3
 Moonshot AI 介绍LNet两篇重要 论⽂的第⼀作者;两位联合创始⼈周昕宇和吴育昕都有10000+的GoogleScholar引⽤。 b. 团队成员囊括NLP,CV,RL(强化学习),Infra⽅⾯新⽣代⼈才,主导了很多有世界影响⼒的⼯ 作,吸引了来⾃Google、Meta、Amazon等全球领先科技公司的海外⼈才加⼊: i. ⼤模型⽅⾯。团队成员发明了RoPE相对位置编码,是MetaLLaMa和GooglePALM等⼤多数 年也是卡在 架构上,缺少真正通⽤的、有⼈愿意去scale的模型。Diffusion明显不是,scale上天了它也不可能 是AGI。今天auto-regressive的架构带来了⼀些新的可能,牺牲了⼀些效率解决了通⽤性。 Auto-regressive本⾝是scalable的,但是tokenizer不⼀定,或者最后就不需要tokenizer,这是24 年的核⼼问题。 了? 杨植麟:对。本质上模型⾜够强的话,它可以处理任何的token、pixel、byte。有了⽆限⻓的 contextlength,你可以直接把硬盘上所有的东西都输给它,它会变成你真正的新计算机,根据这些 context采取⾏动。 海外独⻆兽:OpenAI、Anthropic等领先的模型公司觉得2024年的⼀⼤瓶颈会是数据,所以他们对 怎么⽤合成数据期待⽐较⾼,你怎么看合成数据?0 码力 | 74 页 | 1.64 MB | 1 年前3
共 12 条
- 1
 - 2
 













