Moonshot AI 介绍史上每⼀代技术都是在提升contextlength。 杨植麟⾝上的标签有天才AI科学家、连续创业者……在这次深度访谈中,他再次证明⾃⼰是个真 正“懂”⼤模型的创业者,所以本⽂中有许多反共识的观点:杨植麟觉得微调最终会不存在, tokenizer最后也不⼀定是必须的;硅⾕⼤模型训练者们担⼼数据瓶颈和能源限制,他反⽽觉得所有问 题都是互相关联的,多模态可以缓解数据短缺,合成数据则可以通过改变计算范式解决能源问题。 背定律,本质还是 个能源守恒。只不过我把计算范式改变了,让能源能够以分布式的⽅式解决。 超级应⽤:模型的微调可能最终不存在 海外独⻆兽:Google和抖⾳背后的搜索和推荐有很强的⻜轮效应,算法能根据⽤⼾的⾏为实时反 馈,⽤⼾体验也能不断提升。LLM现在⽆法实时反馈⽤⼾⾏为,AI-Native产品的⻜轮效应会是什 么? 杨植麟:我深⼊思考过这个问题。AI-Native产品最终的 -context仍然不是⼀个共识。但如果今天才看到这个事情,已经没 有⾜够多的时间去迭代,最后会变成跟随者。 第⼆点是能够很深刻的理解AI-Native产品的开发⽅式,然后基于新的⽣产⽅式适配⼀套组织。以前做 产品是通过了解⽤⼾的需求设计功能,新时代需要在制造的过程中完成设计。ChatGPT就是通过制造 完成设计,并没有先设计出来⼀堆场景再找对应的算法。Kimi的⽤⼾⾃⼰去上传简历然后做筛选,也0 码力 | 74 页 | 1.64 MB | 1 年前3
2021 中国开源年度报告本章内容由云启资本投资团队撰写,主要内容包括 : 开源软件商业化成功的底层驱动因素 开源软件公司的可能商业化路径 开源项目投资人判断标准以及案例分享 2 开源软件商业化成功的底层驱动因素 近年来,开源软件商业化的成功已经成为共识。不论是相关公司在二级市场上持续走高的 市值,又或是一级市场上资本的不断涌入,都显示着开源软件商业化模式正得到越来越广 泛的认可。 marketing@yunqi.vc 2021 中国开源年度报告 于公开代码训练其实是在未遵循开源许可证的情况下,肆意“抄袭”开源代码。 118 十、开源硬件持续升温,RISC-V 成果涌现 随着市场对定制硬件需求的增多,以及越来越多初创企业开始寻求用于构建高度合适 AI/ML 算法的加速 器和解决方案,开源硬件的热度持续升温。而随着 RISC-V 处理器 ISA 的出现,开源硬件已成为现实。 同时,RISC-V 在中国得到了越来越多的关注和投入,也有越来越多出色成果涌现出来。 社区的 Dragdu,撰 文透露,社区内部的分歧还与 “Abolish ICE” 运动有所关联。尽管 Rust 社区在诞生之初便倡导和推广 “Rustacean Principles” 原则以凝聚共识,2018 年还成立了专门的“治理工作组”,但社区矛盾未得 到有效缓和。虽然 Rust 编程语言项目近年大获成功,但此次集体辞职事件却也反映了 Rust 社区的治理 难题。 开源软件项目需要不0 码力 | 132 页 | 14.24 MB | 1 年前3
2024 中国开源开发者报告36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 大模型训练中的开源数据和算法:机遇及挑战 57 | 2024 年 AI 编程工具的进化 62 | AI 开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 型从追 随者到行业引领者的跨越式成长,也为全球人工智能发展注入了新的活力与动力。中国开源模型 的成功并非偶然。在政府对人工智能产业的持续支持以及国内人工智能行业对模型研发的巨额投 入下,从基础算法到行业应用、从算力基础设施到数据资源整合,中国人工智能生态体系正在迅 速完善。这一趋势表明,未来中国有可能在全球人工智能领域占据更为核心的地位。 开源生态的繁荣与协作 随着开源模型影响力的提高 LLaMA-2。这个赛道的主要玩家在技术和商业化上有差距, 但没有到翻盘无望的程度。 大模型赛道不但包括模型的训练,也包括模型服务。训练是软件的制作成本,而服 务是软件的长期运行成本。 大模型赛道的市场化程度非常高。算法、算力、数据、人才,这些构建大模型的基 础要素并不为权力机构垄断,大多要从市场上获得。 26 / 111 大模型作为一项令人激动的技术,商业化场景覆盖了对企业(2B)与对个人(2C)两个0 码力 | 111 页 | 11.44 MB | 8 月前3
中国开源软件产业研究报告探索建设国际化开源社区,支持搭建开源开放平台,培育具有国际竞争力 的开源项目和产业生态。 2021.6 浙江省政府 《浙江省数字经济发展“十四五”规划》 推进开源开放平台建设,加强云原生架构、关键算法资源、低代码工具等 供给,培育具有国际竞争力的开源生态。 2021.5 广东省政府 《广东省人民政府关于加快数字化发展的 意见》 支持建设国际化的开源项目和开源社区,共享开源技术、软件代码、硬件 www.iresearch.com.cn 来源:艾瑞咨询研究院自主研究及绘制。 中国开源软件产业发展阻碍 开源是一种建立在信任和共识上的发展机制,为这种机制创 设有序、有活力的环境,是推动我国开源产业发展的关键 中国发展开源软件产业主要面临着技术、组织、产业和文化方面的一些阻碍因素,分别表现为基础技术偏薄弱、缺乏开源 基金会一 件项目的安全 性、兼容性 以 及对错误的响 应和修复机制 共5条,强调项 目的发布过程 可靠并便于获 取 共5条,强调项 目遵循Apache 开源许可证 , 并具备可靠的 版权约定 代码 独立 共识 许可证 发布 质量 社区 共7条,强调项 目具备 公平、 公开、友好、 有价值 、扁平 化运营的社区 共2条,强调项 目独立于任何 公司或者组织 运行,不受其 影响 共5条,强调项 目的组织架构、0 码力 | 68 页 | 3.63 MB | 1 年前3
2023 中国开源开发者报告文件系统的共 享范围和写时复制支持、用于检测固件引起的延迟的硬件延迟跟踪器、对 来自 Project Ara 的 Greybus 总线的支持、更高效的 BPF 分析器、新的可选 BBR TCP 拥塞控制算法、虚拟映射内核堆栈等特性。 由于是 LTS 版本,Linux 4.被广泛用于生产环境,比如基于 Linux 4.9 操作 系统驱动的大规模生产设备/硬件。 写字板是一种基本的文本编辑应用程序, 允许用户创建和编辑带有格式化文本的 漏洞提权,下载并执行额外的恶意模块,其中一些还获得 了访问用户通知和文件的权限。 某国产电商 APP 利用 Android 漏洞提权 2023 年 3 月 31 日,马斯克 终 于 履 行 诺 言 正 式 开 源 Twitter 算法,并表示“今天 标志着 Twitter 进入了一个 透明的新时代。我们正在与 全世界共享为推特平台提供 底层支持的大部分源代码”。 路透社:开源软件成为贸易战的重要环节 2023 年 2 月 27 braces for trade war》。文章指出,开源软件运 动已成为全球创新和生产力增 长中前所未有的推动力。然而, 不断加剧的地缘政治紧张局势 正在危及开源未来的经济贡献。 Twitter 开源推荐算法 2023 年 3 月发生了两起俄罗斯公司开发者被阻止向开源软件(FOSS)贡献代码 的事件。一是任职于俄罗斯芯片制造商 Baikal Electronics 的开发者 Sergey Semin。Linux0 码力 | 87 页 | 31.99 MB | 1 年前3
2020 中国开源年度报告
Apache 代码上的⼯作提供报酬)。 ⼤多数 Apache 邮件列表都是存档的,并且可以公开访问,以确保⾃动协作,这些是⼀个 全球分布的社区所必须的条件。 由于⽆法在任何时候都达成完全共识,此时就可能需要传统⽽具有约束⼒的投票或其他协 调⽅式,以帮助消除决策障碍。 负责任的监督:ASF 治理模式以信任和授权监督为基础,让项⽬⾃治并直接向董事会提供 报告。Apache 提交者 (3)案例分析——MindSpore 项⽬简介 MindSpore 是⼀种适⽤于端边云场景的新型开源深度学习训练/推理框架。 MindSpore 提供 了友好的设计和⾼效的执⾏,旨在提升数据科学家和算法⼯程师的开发体验,并为 Ascend AI 处理器提供原⽣⽀持,以及软硬件协同优化。 项⽬地址:https://gitee.com/mindspore/mindspore 相关数据(数据选⾃仓库0 码力 | 46 页 | 4.09 MB | 1 年前3
2021 中国开源年度报告Underlying Drivers of Successful Commercialization of Open Source Software 近年来,开源软件商业化的成功已经成为共识。不论是相关公司在二级市场上持续走高的市值, 又或是一级市场上资本的不断涌入,都显示着开源软件商业化模式正得到越来越广泛的认可。 In recent years, the success of continues to heat up and RISC-V achievements emerge 随着市场对定制硬件需求的增多,以及越来越多初创企业开始寻求用于构建高度合适 AI/ML 算法的加速器和解决方案,开源硬件的热度持续升温。而随着 RISC-V 处理器 ISA 的出现, 开源硬件已成为现实。同时,RISC-V 在中国得到了越来越多的关注和投入,也有越来越多出 色成果涌现出来。 (OpenAnolis)已拥有 50 多家生态企业。其中统信软件、中国移动云等已基于龙蜥操作系统 发布商业版本。龙蜥也是国内首个从操作系统层面提供全软件栈国密算法的 OS 解决方案,并且 对内核 SM4 算法做了深度优化,性能提升近 800%,让中国国密算法从合规走向生产应用。 It is also against this background that in September 2020, AliCloud0 码力 | 199 页 | 9.63 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)学习平台。截至 目前,TiDB社区有超过96K请求、20K主题、196K帖子、2100贡献者。 TiKV:TiKV是一个分布式事务型的键值数据库,提供了满足ACID约束的分布式事务接口,并且通 过Raft协议保证了多副本数据一致性以及高可用。TiKV作为TiDB的存储层,为用户写入TiDB的数据 提供了持久化以及读写服务,同时还存储了TiDB的统计信息数据。TiKV于2018年8月被云原生计算 基 2015年4月 PingCAP连续两年在CNCF全球贡献排行榜中位列中国企业第一位,全球排名第6位 TiDB通过信通院分布式数据库性能与基础能力两项评测 PingCAP团队的论文《TiDB: A Raft-based HTAP Database》入选VLDB 2020,成为业界第一篇 Real-time HTAP分布式数据库工业实现的论文;CNCF宣布TiKV正式从CNCF毕业 CNCF 宣布云原生的混沌工程Chaos0 码力 | 22 页 | 1.99 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书中华人民共和国密码 法(2019.10.26) 中华人民共和国数据 安全法(2021.06.10) 中华人民共和国电子 签名法(2019.04.23) • 这里的安全中间件是 指支持国家标准密码 算法及其他国际算法, 通过参数转换、对象 管理、接口调度等模 块,完成身份认证、 安全邮件、安全传输 等安全业务场景的中 间件 • 安全中间件开源厂商 较少,主要使用国外 OpenSSL , 或 基 于 OpenSSL的二次开源 中国主要开源AI框架分类 2016.9 通用型AI框架开源发起者多为互联网或ICT巨头(BATH),一方面AI框架的能力提供需 要基于底层的基础算力、通信及云技术,科技巨头在此有较深厚的积累,另一方面AI的 接口提供、算法优化以及工具套件均需要较强的技术实力,这也是科技巨头的优势所在 基础设施层 AI工具层 模型服务层 2020.3 2018.12 2017.6 开源后共迭代18次,最新版 3.2.0更新于2021年8月 下支持包括CPU、GPU、昇腾的多类 型算力,向上支持国内包括紫东·太初2、秦岭·翔语、CodeGeeX、鹏程·神农、空天·灵眸等50+大模型。MindSpore深耕学术应用, 在加速科学实验、启迪算法发现及促进计算优化方面支撑我国科学计算深化发展,在电子制造、生物医药、流体领域做出“AI+科学 计算”的创新成果。 MindSpore 提供AI开发全种类套件,原生高效支持大模型开发及科学计算0 码力 | 43 页 | 4.69 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021网易数帆是网易集团旗下 TO B 企业服务品牌,定位于领先的数字化转型 技术与服务提供商,为客户提供创新、可靠的国产软件基础平台产品及相 应技术服务,业务覆盖云原生基础软件、数据智能全链路产品、人工智能 算法应用三大领域,旗下拥有轻舟、有数、易智三大产品线,致力于帮助 客户搭建无绑定、高兼容、自主可控的创新基础平台架构,快速应对新一 代信息技术下实现数字化转型的需求。 网易数帆依托网易二十余年互联网技术积累,系列软件基础平台产品和技 接口 填报数据 大数据平台 数据连接 数据接入 SQL语句数据建模 可视化数据建模 轻量化 ETL 建模 对接数据中台模型 数据建模 数据分析 报告 智能图表推荐 多种高级算法 自助式 拖拽分析 智能AI 辅助分析 数据大屏 复杂报表 数据展示 数据门户 智能决策 自助取数 企业系统对接 移动应用对接 数据应用 数据应用 PRODUCT 企业级敏捷 自动歌词 语音交互 人机协作运营 创新体验 易智字幕工具 易智语音工具 音视频效率工具 行业应用 产品 解决方案 语音技术 自然语言处理 计算机视觉 能力 组件 技术领先 算法能力行业领先,多次斩获 国内外技术竞赛最高奖项。 实践成熟 长期服务网易集团内大量业 务及产品,实践验证成熟可 靠。 贴合行业 产品和解决方案更贴合用户 的业务场景,提高用户体验。 部署灵活0 码力 | 43 页 | 884.64 KB | 1 年前3
共 11 条
- 1
- 2













