Moonshot AI 介绍能还是如何有 ⼀个统⼀的表⽰空间以及可规模化的数据⽣产。 海外独⻆兽:如果算⼒⾜够,会有⼈想做⼀个万亿参数的densemodel吗? 杨植麟:取决于推理成本的下降速度,但我觉得肯定会有。现在⼤家是因为推理成本太⾼,所以都在 做tradeoff。但是最终直接训练⼀个万亿的densemodel肯定效果会⽐⼀个只有千亿参数的模型要 好。 海外独⻆兽:Anthropic 。 到了GPT-6这⼀代,掌握合成数据技术的玩家会体现出明显差距。因为数据其实有两种,⼀种是做 pre-training的数据,另外⼀种是获取成本更⾼的alignment数据。如果掌握了数据⽣成技术, alignment的成本可能会降低好⼏个数量级,或者能⽤⼀样的投⼊产⽣更⼤的⼏个数量级的数据,格 局就会发⽣变化。 我觉得2025、2026年可能是很重要的milest one⸺模型的⼤部分计算量会发⽣在模型⾃⼰⽣成的数 据上。 26年的时候也许模型⽤于推理的计算量会远远⼤于训练本⾝,可能花10倍的成本去推理,推理完之 后花⼀倍的成本来训练。会出现新的范式,推理即训练,⽽且这个推理不是为任何⽤⼾服务的,只为 ⾃⼰本⾝的合成数据服务。 出现这种情况的话,能源的问题也解决了,因为推理是可以分布式的。⽽且它不违背定律,本质还是 个能源守恒。只不过我0 码力 | 74 页 | 1.64 MB | 1 年前3
2021 中国开源年度报告的比例偏低,技术人员梯度不够合理,也是国内各大开源社区在吸引贡献者方面,可以优化的地方。 段夕华:近些年来,学生在开源人群中占比持续增多到今天接近一半,可能也是因为用人单位越来越认可学生 在开源中所展现出的编程技能、沟通能力及合作精神,因此这其中应该也不乏各种刷榜行为,需要开源项目所 有者更多关注学生贡献者增多所带来的质量、合规等问题。 杨丽蕴:我国开源人才后备力量足、基数大。 我国高校越来越重视开源人才的培养 堵俊平:在欧美,邮件列表和 Issue 是开源开发者交流的主要方式,这样既可以公开、透明,又可以把讨论的 过程沉淀下来,降低后加入者的学习成本。国内开发者当前习惯在微信群中讨论问题,但受限于微信群的规模 以及非公开的讨论问题的方式,需要聊天机器人等辅助工具才能达成开源社区的沟通需要。 34 4.7 开源社区中重要的角色 受访者们认为开源社区中核心开发者、社区管理人员、普通开发者、布 道师都是很重要的角色,他们共同支持着社区的良好运转。 对于受访者来说,一个项目的开发者活跃度、所加入社区信息的完整度、 Readme 简介、开源许可证以及核心开发者的及时回复都能够影响其是 否会留下成为项目的贡献者。 专家点评 堵俊平:谁说工程师不善于沟通?对开源项目而言,社区的氛围以及交流和沟通是开发者留存的关键因素。 段夕华:最后这个指标跟前面调查中的社区和谐诉求本质是相通的,那就是马斯洛需求层次中的「尊重和被认 可的需求」 36 4.9 开源项目是否集成 RPA(机器人流程自0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告optimized to attract contributors. 段夕华:近些年来,学生在开源人群中占比持续增多到今天接近一半,可能也是因为用人 单位越来越认可学生在开源中所展现出的编程技能、沟通能力及合作精神,因此这其中应 该也不乏各种刷榜行为,需要开源项目所有者更多关注学生贡献者增多所带来的质量、合 规等问题。 Duan Xihua: In recent years, the proportion 堵俊平:在欧美,邮件列表和 Issue 是开源开发者交流的主要方式,这样既可以公开、 透明,又可以把讨论的过程沉淀下来,降低后加入者的学习成本。国内开发者当前习惯在 微信群中讨论问题,但受限于微信群的规模以及非公开的讨论问题的方式,需要聊天机器 人等辅助工具才能达成开源社区的沟通需要。 Du Junping: In Europe and the United States, mailing lists will stay as a contributor to the project. 【专家点评】/ [Expert Comment] 堵俊平:谁说工程师不善于沟通?对开源项目而言,社区的氛围以及交流和沟通是开发者 留存的关键因素。 Du Junping: Who says engineers are not good at communicating? For open0 码力 | 199 页 | 9.63 MB | 1 年前3
中国开源软件产业研究报告“集市” “大教堂” 依靠精英,自上而下 依靠大众,自下而上 “集市”开发模式强调为众多的开 发者创设一个鼓励创新、交流的公 平和公开环境,在开发者能够自由 交换关于软件进步路径的看法,并 在沟通过程中自然选择出最合适的 方向。这一模式可能更适合具备长 期成长价值和进步空间的基础软件。 通过“德尔菲方法”实 现不断进化 效率至上,商业结果导向 8 ©2022.2 iResearch Inc 软件开源的成本效益 估算开源为企业项目节省38%的直接开发成本,其他成本和 收益也应纳入考量 经统计,企业进行软件开发的成本拆解到需求、设计、构建、测试、实施等五个环节后分别占比13%、13%、41%、23% 和10%。其中,开源能够在需求收集整理、软件构建和实施三个环节节省较高比例的成本,在软件设计、测试量个环节也 有一定降本效果,经估算,开源能够为项目节省38%的直接开发成本。对于企业而言,还应该纳入开源的成本&收益考量 言,还应该纳入开源的成本&收益考量 的因素包括:软件开源后为企业带来的引流价值和市场宣传等价值、项目直接商业化销售和开源形成的收入差、企业建设 开源团队和办公室的管理支出。 项目开源节省的企业软件开发直接成本估算 需求 13% 设计 13% 构建 41% 测试 23% 实施 10% A:80% A:20% A:30% A:10% A:100% 需 设 构 测 实 •0 码力 | 68 页 | 3.63 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021微服务应用优势 巨石(单体)应用 代码级的依赖,容易出现代码冲突,以及影 响范围扩散,导致大量的沟通,开发效率低 随着规模增加 编译时间快速增加 代码级的依赖,需要全量测试 测试回归周期长 代码修改对整个应用有影响,需要全量测试 无法有效对需求快速变化 单一技术架构 技术演进需要全部重写,成本高 开发效率 编译时间 测试周期 应对需求变化 技术演进 对比项 微服务应用 基于服务接口的依赖 各服务间独立开发,开发效率高 微服务独立编译 编译时间短 基于服务接口的依赖 仅需要测试相关服务,测试回归周期短 仅相关服务需要开发 无需全量测试,能够快速应对需求变化 微服务可以技术独立演进 成本低 PRODUCT 13 PRODUCT 基于可视化编程语言 基于通用语言封装的可视化开发语言,具 备完善的静态类型系统和组件扩展机 制,适合 80% 企业级应用开发,灵活性 高,可靠性强。 等不同粒度软件资产,均支持复用。 零成本部署运维 产出应用支持自动化部署在云原生平台 之上,无运维的代价,集成网易运维实 践。 产品能力 首批通过信通院认定项目:首批低代码无代码开发平台通用能力评测 产品荣誉 低代码开发优势 传统研发 以命令行语句为基础的 开发体系 需要掌握开发语言 (JAVA、C++、Python) 灵活性强 可满足95%业务研发需求 开发速度慢、周期长 效率低下人员成本高 可灵活集成0 码力 | 43 页 | 884.64 KB | 1 年前3
2020 中国开源年度报告
,尤其⿎励⼤家积极参与线下活动。线下的⻅ ⾯、沟通有助于建⽴起⼈与⼈之间的信任,对于社区的繁荣、⼈与⼈之间更⾼效的协作有重要 意义。 关于开展线上还是线下的开源活动/会议,参与者们各抒⼰⻅,线下活动可以⾯对⾯地沟通交 流,交流更有效率,氛围更好,可以有更多⾛出去看看,结交新朋友的机会,⽽线上活动则更 加安全、便捷,不受时间、地域等限制,成本低廉,且会议内容可以录像,⽅便会后复查,当 然,线下录像也是越来越普遍。 的参与者表示从 来没有在开源项⽬中集成过 RPA。 5、开源社区参与现状 5.1 开源最吸引你的因素 开放透明的代码和知识共享,以及开源的精神理念成为开源最吸引参与者的因素,⽽软件的购 买成本却并不是主要的因素。 5.2 最喜欢的开源产品是什么 Linux 以巨⼤优势,成为参与者最喜爱的开源产品,MySQL 紧随其后,Apache 和容器界的⿊ ⻢ Docker 分别位列第三、第四。 3.1 简介 Apache 软件基⾦会(ASF)成⽴于 1999 年,是⼀个依据 501(c)(3) 在美国成⽴的⾮营利性 公共慈善组织。基⾦会致⼒于: 提供基础设施:为开源项⽬⽬提供硬件,沟通交流以及项⽬⽬治理等⽅⾯的基础设施; 提供⽤于捐赠的法律实体:建⽴⼀个独⽴的法⼈实体,公司和个⼈可以向其捐赠资源,并 确保这些资源将⽤于公共利益; 提供法律保护框架:为个⼈志愿者提供法0 码力 | 46 页 | 4.09 MB | 1 年前3
2024 中国开源开发者报告系列凭借灵活的多尺寸选项,强大的多语言支持以及友好的模型授权功能, 赢得了社区开发者的高度评价。DeepSeek 通过引入多头潜在注意力(Multi-head Latent Attention, MLA)技术,在性能和成本上实现了革命性突破,开创高性价比的 AI 新纪元。 智谱的 CogVideoX 系列文生视频模型,成为全球首批开源的文生视频模型之一,不仅在 技术方面让中国视频生成模型列入领先梯队,强化了中国模型在全球范围的竞争力,也为国际开 术的使用和合规要求,促进了开源模型在合规框架下良性发展。 变革 端上模型的兴起与隐私保护 随着小型模型的性能逐步增强,更多高级 AI 正转向在个人设备上运行。这一趋势不仅显著 降低了云端推理成本,还提升了用户隐私控制。 中国 AI 社区在这一领域也做了重要贡献,推出了如 Qwen2-1.5B、MiniCPM 系列和 DeepSeek Janus 等多款移动友好型模型。其中,最新发布的 GLM 扩展的联合优化,在搭载骁龙 8 Gen 4 处理器的手机上实现了每秒 65 个 tokens 的推理速度,接近人类语音的平均输出速率。尽管存在电池续航和内存占用过大等挑战, 端上模型代表了 AI 技术隐私保护和成本优化的未来方向。中国在这一领域的探索,为行业提供 了宝贵经验。 推理扩展法则的潜力释放 通过推理扩展法则,模型性能可通过延长“思考时间”而进一步优化。这一技术模拟了人类 “深思熟虑”的过程,0 码力 | 111 页 | 11.44 MB | 8 月前3
2023 中国开源开发者报告它的核心在于研究人类如何与 LLM 更好地进行“沟通”, 找到让 LLM 能够准确理解人类意图的方法。提示词工程探 索如何以 LLM 可以解析的方式来表达需要它完成的任务, 寻找 LLM 的“最佳输入形式”。通过注入提示词,提示词 工程建立了一套“人机交互语法”,来更精准地向 LLM 传 达想要它生成何种输出的指令。这为人们与 LLM 之间建立 高效、准确的“沟通桥梁”提供了可能性。什么“链式思考 目。aardio 的所有库基本都是由作者一个人编写,并且 17 年来一直保持非常活跃的 更新。 aardio 是一门专注于桌面软件开发的编程语言,特点是小、轻、快,体 积仅 6.5MB,学习和使用成本极低。aardio 虽然小,但提供了惊人数量 的开源标准库、扩展库 —— 这些库基本都是由纯 aardio 代码实现。 开源项目 Touca 开发商倒闭 开 源 测 试 工 具 Touca 的 创 的流媒体平台 Prime Video 在 2023 年 3 月 22 日 发布了一篇技术博客《规模化 Prime Video 的音视频监控服 务,成本降低 90%》,副标题: “从分布式微服务架构到单体应 用程序的转变有助于实现更高 的规模、弹性和降低成本”。 这种话题与业内推崇的微服务 架构形成了鲜明的对比,从而在 技术圈引起了热议。 是微服务架构不香还是云不香? Asahi Linux 首席开发人员0 码力 | 87 页 | 31.99 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)的计划,并与相关的国家和国际网络建立合作关 系。 “在南萨沃地区建立开源能力中心是一项具有前 瞻性的、卓越的举措,旨在填补开源软件在采用 和使用中存在的知识鸿沟,使地区企业和公共机 构能够充分发挥出开源软件在推动创新、促进协 作、控成本、创效益等方面的巨大潜力”。芬兰 开放系统和解决方案中心(COSS)的执行主任 Timo Väliharju评论到。 Open MemoryLab项目于2022年10月启动,计 划持续到2023年底。该项目由芬兰东南应用科 b上开源,是一款定位于在线事务 处理/在线分析处理的融合型数据库产品,实现了一键水平伸缩,强一致性的多副本数据安全,分 布式事务,实时OLAP等重要特性。同时兼容MySQL协议和生态,迁移便捷,运维成本极低。TiDB 社区是由 TiDB 生态中的开发者、用户、Contributor、合作伙伴一起建立的分享、学习平台。截至 目前,TiDB社区有超过96K请求、20K主题、196K帖子、2100贡献者。 席架构师会请求 公共管理部门考虑在其正在开发的解决方案中使用开源软件。如果公共行政部门决定使用开源软件, 对源代码的任何修改都应公开,以便在整个公共部门体系中进一步共享和重复利用。购置、维护和支 持成本等标准是使用开源软件的决策进行评估的依据。 在过去几年中,捷克公共行政部门使用开源软件解决方案的情况有所增加。通过最近对数字管理结构 的重组,政府提高了在数字政策不同措施之间的协调可能性。捷克的各级行政部门中,有各种各样的0 码力 | 22 页 | 1.99 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书年投入开源项目的资金量达到10亿元级别,同时企业从包含技术、产品、运营、战略、职能各部门组织超过千人的团队,投入到开 源项目的治理。近年来,越来越多的企业选择在内部设立开源部门/开源办公室(OSPO)/开源委员会,统筹沟通企业开源人员,协 调开源资源分配,体现了企业对于开源战略及运营重视高度的提升。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 法务服务 社区 治理 社区 运营 代码 审核 www.iresearch.com.cn AI框架能力指标 可达智能水平、资源投入、开发者友好度、人时成本是框架四大能力指标 去除如代码贡献者数量、版本下载量等AI社区指标,仅从框架自身角度,开发者主要通过可达智能水平、开发资源投入量、开发者 友好度、开发人时成本四方面衡量AI框架的能力水平,他们分别影响着AI模型的最终性能、配合框架需投入的资源水平、开发者上 手框架实现开发的门 署、开发到落地的完整流程 中,所需投入的人时成本。部 分AI无法做到并行开发,以扩 大开发人数的方式缩短开发周 期不再可行,因此AI框架开发 效率是开发时长的重要因子。 AI框架编译难度是在此框架下 做应用、训练开发设计的难易 程度。以开发者的角度,这对 应了AI框架的不同范式,不同 的AI框架都有一定的学习成 本,会影响开发者使用AI框架 的便捷程度。 开发人时成本 API接口 编程语言 内存优化0 码力 | 43 页 | 4.69 MB | 1 年前3
共 12 条
- 1
- 2













