中国开源软件产业研究报告LGPL:如果类库引用(链接,不修改)则可以闭源商用,否则不能够闭源商用。 EPL:没有修改过,可以直接商用;有修改过,必须在公布源代码的条件下商用,这种 情况下与GPL的发布条件类似。 • 从定义上看,所有的开源协议本质上都是允许“商用”的,之所以在实践中存在一系列开源软件商用后的侵权问题,本质上说 是由于开源许可证的“传染性”。带有“传染性”开源许可证的软件要求企业/个人在对其进行修改发布时保留原来的开源许 www.iresearch.com.cn 来源:艾瑞咨询研究院自主研究及绘制。 开源产业主体及产业关系 开源社区运营为核心,注重开源用户和贡献者的反馈 从产业主体的角度上看,开源软件产业市场上的主体包括软件的源作者(个人/企业)、开源基金会、开源社区(包括代码 托管平台、软件论坛、行业联盟)、二次开发者和使用者等。源作者在开源社区中发起开源项目,这意味着将软件源代码 www.iresearch.com.cn 来源:艾瑞咨询研究院自主研究及绘制。 企业的开源商业模型(一) 软件开源为企业带来直接收益、渠道收益、行业生态收益 从商业成功的角度上看,企业发布开源软件能够为自身带来直接商业化收益、渠道收益和市场影响力提升带来的产业协同 收益。其中,直接商业化收益包含企业提供开源软件的收费版本、专业服务和引流广告收入;渠道化收入主要包含开源软0 码力 | 68 页 | 3.63 MB | 1 年前3
2021 中国开源年度报告2022 年来了,网上有一个段子,说这不过是“2020 too”,2022 年 1 月,也不过是 2020 年第 25 月。看起来一切都没有变化,我们 依然在 COVID 之中。但是,从另一个角度来看,世界正在发生巨变, 我们所处的世界,正在高速朝着某个未知的方向前进。 对于中国开源而言,2021 年的关键词,应该是“助跑”。迹象已经 非常明显,工信部信息技术发展司发布了《“十四五”软件和信息技 这个前言里,我们就聊聊感想吧。 出圈 开源不仅越来越热,而且已经在圈外的朋友中引发了各种讨论。首 先是嗅觉灵敏的投资人开始关注开源这个“赛道”,然后是基于中美 对抗的背景,很多人开始从国际政治、国家实力、国家安全的角度, 来探讨开源(这个原本是纯技术的范畴)。直到最近几起开源软件安 全事件,更是令大家议论纷纷。这样一个令人喜忧参半的现象,也 许还会继续持续下去。 生态责任 在开源还只是一个小众群体的业余爱好时,几乎做任何事情,都是 10 年、20 年,我们再回来看我们这些开源人,所做的这些事情,哪 些做对了?哪些做错了?哪些应该更早去做?这样的感受,就是一 种“历史感”。当我们更多具备这样的历史感,更多以将来会被人回 看的心态,来做这些事情时,我们又该如何抉择?又该如何行动呢? 当然,千里之行,始于足下。那个我们无限向往的未来,也只能由 我们的点滴努力来塑造。与诸位共勉吧! 庄表伟,开源社理事长 2022 年0 码力 | 132 页 | 14.24 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书组织的建立这两个角度看出。权威性组织的建立方面, 全球开源软件标准的权威发布机构OSI于1998年成立,但国内第一个权威性开源软件推进联盟成立于2004年;再如阿帕奇软件基金 会于1999年成立,而中国开放原子开源基金会成立于2020年。起步晚也是上文中提到的开源意识欠缺等现象的主要原因。然而,不 管是从世界的角度,还是国内的角度,中国开源产业仍处在“积极的上升期”。 从世界角度看中国开源产业增长 4%,而中国开源贡献者的比例预计将 达到13.3%,同时期预估其他贡献率强劲的国家数据分别是印 度(7.9%)、巴西(3%)、尼日利亚(1.5%)。 Github2025年开源贡献者比例预估(按国别分) 从国内角度看中国开源现状 Gitee2022年平台上开源指标的变化 平台仓库 2500万 新增用户 200万 新仓库 480万 总用户 1000万 CSDN2023年调研:使用开源软件的开发者比例 源主要由科技巨头领导,结合了企业内部应用实践, 开源范围覆盖底层通信框架与相关服务治理,与云环境的关联更多,并在一些功能性较强的板块衍生出开源小领域,但是从中间 件功能板块、开源项目数量角度、商用活跃状态等角度看,整体开源生态仍较为薄弱。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 RPC框架类 作为基础设置提供远程过程调用的功能,用于不同 服务之间的通信和数据传输 PhxRPC0 码力 | 43 页 | 4.69 MB | 1 年前3
2024 中国开源开发者报告(OCR)、语音合成(TTS)、人脸识别等等垂直领域,一个 1B~7B 的小模型已经可以满足很 多生产、应用需要,并且效果也在逐步推高【8,9,10】。这些模型,作为智能体的“三头六臂”, 不需要太“大”。 同时,从学术角度来讲,各种领域专用模型的技术最优解也在逐渐趋同。应用开发者越来越 不需要了解模型的底层技术,只需要懂得如何设计自己应用的任务流,懂一点点 COT 系列的 prompt engineering 的技巧,就可以利用 表征)会逐步趋同,构建对这个世界的统一认知。这 也符合我们人类对世界的认知:人类通过语言文字这 种符号,将不同模态的信号统一地表达,并在脑中构 建了某种受限于当前科技水平的统一模型,这是人类 意识、社会沟通的前提。 从这个角度理解,多模态大模型很可能是通向真 34 / 111 正 AGI 的必经之路。将多模态信号统一对齐,是智能体与这个世界“无障碍”交互的前提,换 个新潮的词汇,就是我们期待的“具身智能”。谁不想拥有一台自己专属的“Javis”呢?而多 意图,全面提升代码评审的能 力。 有些团队,根据 UI 设计图,让 LLM 自动生成相应的前端代码,大大减少了手动编码的时间, 加快了从设计到实现的流程。 43 / 111 从应用效果看,前面调研的数据可供参考。在国内 AI 编程开展比较好的大厂,超过 80%的 工程师在使用 AI 编程工具完成日常的编程工作,近 30%入库的代码由 AI 生成,生成代码平均 采纳率超过 40%,有些产品线达到0 码力 | 111 页 | 11.44 MB | 8 月前3
2021 中国开源年度报告2022 年来了,网上有一个段子,说这不过是“2020 too”,2022 年 1 月,也不过是 2020 年第 25 月。看起来一切都没有变化,我们依然在 COVID 之中。但是,从另一个角度来看,世界 正在发生巨变,我们所处的世界,正在高速朝着某个未知的方向前进。 There is an internet joke saying that 2022 is just 2020 .. Circle 开源不仅越来越热,而且已经在圈外的朋友中引发了各种讨论。首先是嗅觉灵敏的投资人开始 关注开源这个“赛道”,然后是基于中美对抗的背景,很多人开始从国际政治、国家实力、国家 安全的角度,来探讨开源(这个原本是纯技术的范畴)。直到最近几起开源软件安全事件,更 是令大家议论纷纷。这样一个令人喜忧参半的现象,也许还会继续持续下去。 Open source is getting hotter 样?如果再过 10 年、20 年,我们再回来看我们这些开源人,所做的这些事情,哪些做对了? 哪些做错了?哪些应该更早去做?这样的感受,就是一种“历史感”。当我们更多具备这样的历 史感,更多以将来会被人回看的心态,来做这些事情时,我们又该如何抉择?又该如何行动 呢? For the fourth consecutive year, KaiYuanShe has published the China0 码力 | 199 页 | 9.63 MB | 1 年前3
2023 中国开源开发者报告我国大语言模型市场规模有望达到 600 亿元。 十二、 如果要指出当前 LLM 种种“不成熟”中我最关切的,我会 说“LLM 解决方案”。 当前 LLM 行业面临的一个大方向上的问题是:还没有很好 地从“解决方案”的角度去做技术或者应用。 所谓“解决方案”,是指在设计和开发 LLM 技术和应用时, 首先明确用户的目标,然后围绕目标进行技术研发和应用设 计,并且它带有“整体解决”、“解决的不只是某个单点问题” 往深了说,或许这本质上就是在要求 AGI,而它是一个更 长远的路途了。 而如何将更完备的解决方案给到用户,如何将更平台化、 体系化的生成解决方案的技术给到解决方案生产者,是后 续 LLM 应用与技术演进的重要路标。你看 GPTs,直接 革掉了多少拿 OpenAI API 去套壳的“创新应用”的命? 十三、报告介绍 作为《2023 中国开源开发者报告》的引导,这里还是把 话题拉回来,简介一下整个报告。 前边讲到的 次年度报告中整理成了另一个篇章《开源开发者事件回顾》, 这一篇章梳理成了 9 个大块: 【AIGC】回顾 2023 大语言模型 LLM 元年的重磅事件。 【1024 黄金眼】关注 IT 相关民生事件,以老百姓的眼 睛看 IT 圈,和开发者零距离接触。 【项目停更】到了该说“再见”的时候了,江湖有缘再见。 【生产事故】冥场面!速来围观 2023 十大生产事故“名 场面”。 1 1 目录 一、开源开发者事件回顾0 码力 | 87 页 | 31.99 MB | 1 年前3
Moonshot AI 介绍亿的contextlength,今天看到的问题都不是问题”。 AGI:AI本质就是⼀堆scalinglaw 海外独⻆兽:我们把LLM的训练⽐作登⽉,⽉之暗⾯的名字也和登⽉相关。你怎么看现在创业公司 的LLM训练,在GPU和算⼒资源有限的条件下,还能实现登⽉吗? 杨植麟:“登⽉”有⼏个不同的⽣产要素,算⼒肯定是⼀个核⼼,但还有其他的。 你需要⼀个同时满⾜scalab 历史上基本所有的互联⽹产品要跑出来,最终都要靠⽤⼾数据的scale。今天MidJourney已经能看到 ⼀些迹象,它通过“吃”⽤⼾的scalinglaw可以胜过basemodel的scaleup,但如果只看语⾔模型 和⽂本,basemodel的scaling效果仍然远远超过⽤⼾的,但我认为最终会转移到⽤⼾的scaling law,只是个时间问题。 现在⾯对数据瓶颈,这⼀点尤为重要。特 类偏好数据,它⾮常有限,但没有它⼜不⾏。我觉得 这也是每⼀个AI-Native产品现在最值得思考的问题之⼀。所以,⼀个不⾜够关⼼⽤⼾的公司最终可能 也没法实现AGI。 海外独⻆兽:怎么看MoE?有⼀种说法是MoE不是真正的scaleup,只有scaleupdensemodel 才会提升模型的能⼒。 杨植麟:你可以认为带MoE和不带MoE是两条scal0 码力 | 74 页 | 1.64 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)Grygov35:自2006年以来,格里戈夫(Grygov)地区的行政应用程序、免费公共互联网以及用于 向1,400名居民及时更新本地问题的SMS信息系统大多采用了开源软件(OSS)解决方案。在经费有 限的条件下,从财政角度来看,使用开源软件的潜力十分广阔。此外,该软件是开源的这一事实意 味着它是持续更新的,这意味着用户遇到IT问题的可能性较低。 24 https://cityvizor.cz/landing 250 码力 | 22 页 | 1.99 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021层面加快业务高效运营和有 效决策。 灵活 组件式插件化产品架构,基于 用户的发展阶段,提供量身定 制的大数据产品和解决方案。 16 网易数帆旗下大数据技术与服务品牌 网易有数以“数据价值”为导向,聚焦于企业 “看数”、“管数”、“用数”等业务场景,提供全链路大数据技术及产品服 务,致力于盘活企业数据生产力,加速实现数字化转型。 数仓设计中心 指标设计 模型设计 数据治理中心 数据质量 数据地图 数据资产0 码力 | 43 页 | 884.64 KB | 1 年前3
2020 中国开源年度报告
2020 中国开源年度报告 前⾔ 撰写这篇前⾔,我们的⼼情⼀直很复杂,很难⽤某种词汇来概括。在⼼⾥升起的⼀句话 是:“这是最好的时代,这是最坏的时代”。 也许多年以后,我们回看 2020 年,会将其称之为:世界剧变之始。很多朋友在去年,甚 ⾄“每⼀天都在亲历历史,每⼀天都是活久⻅!”新冠疫情与中美贸易战,在同⼀年加剧。⽽因 为疫情和贸易战,世界正在加速发⽣变化。 在这样的历史⼤背景下,我们在开源界,也发现了以下三个趋势:0 码力 | 46 页 | 4.09 MB | 1 年前3
共 10 条
- 1













