Moonshot AI 介绍杨植麟对于⽤transformer这个概率模型的思想基础⾛向AGI也很有信⼼,⽤他的话说“如果你有10 亿的contextlength,今天看到的问题都不是问题”。 AGI:AI本质就是⼀堆scalinglaw 海外独⻆兽:我们把LLM的训练⽐作登⽉,⽉之暗⾯的名字也和登⽉相关。你怎么看现在创业公司 的LLM训练,在GPU和算⼒资源有限的条件下,还能实现登⽉吗? alinglaw来解决。但不⼀定是在pre-training环节,因为其实 alignment也有scalinglaw,它肯定是可以被解决的,只要你能找到对的数据。AI本质就是⼀堆 scalinglaw。 海外独⻆兽:你对AGI的预期是什么?transformer本质还是⼀个统计概率模型,它能通往AGI吗? 杨植麟:统计模型没有什么问题。当next ,但我认为微调可能不是本质的⽅法,⻓期来 看可能不会存在模型的微调。为什么?当你的模型指令跟随能⼒、推理能⼒、上下⽂⼀致性能⼒越来 越强时,所有东西只需要放在内存⾥就可以。⽐如你的⼤模型内存有⼀堆prefix这样的东西⽤来 follow,成本可以降到⾮常低。最终,你对模型个性化的过程实际上就是你所有的交互历史,也是⼀ 个包含了你的偏好和反馈的集合,这些反馈会⽐上个时代的产品更直接,因为它是完全通过对话界⾯0 码力 | 74 页 | 1.64 MB | 1 年前3
2023 中国开源开发者报告速度明显快于 3.6。 curl 8.4.0 于 2023 年 10 月正式发布。该版本修复了一个高危安全漏洞: SOCKS5 堆溢出漏洞 (heap buffer overflow),该漏洞 (CVE-2023-38545) 导致 curl 在 SOCKS5 代理握手过程中溢出基于堆的缓冲区。 Mojo 编程语言开放下载 Mojo 是 Modular AI 公司开发的新编程语言,它结合了 Python 做接入层日志过滤,然后成本高得吓人,性价比非常低。 osc_78692802:我们两三个人的开发团队开发个并发不到 300 的产品竟然 使用 java+spring+微服务。本机调试个项目开一大堆工具、idea 都得开 3 个。 改个 java 类还得等热部署,写个极其简单的功能实体类、DTO、mapper、接 口等要建 20 多个文件,还要应对经常变化多端的业务,搞毛线啊。 nginx+php+db0 码力 | 87 页 | 31.99 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书主要能力提供模块 总开发人数 单人平均开 发时长 模型库 扩展库 套件库 科学计算 主要能力提供模块 文档 可视化训练 调试器 课程教程 主要能力提供模块 非并行的开 发模式中无 法通过“堆 人”方式缩 短开发时长 选择最具效 率 的 AI 框 架是降低人 时成本的重 要方式 35 ©2023.11 iResearch Inc.0 码力 | 43 页 | 4.69 MB | 1 年前3
2024 中国开源开发者报告序。2025 年会成为大模型应 用或 AI 应用之争。 另外还有一个趋势也很明显,就是知识管理和协作。我们都说这波 AI 浪潮把原来“没用” 的非结构化数据给激活了,所以我们马上会看到那些原来堆在角落里面的“冷”文件和知识(类 似 wiki)会被大量启用,“热”文件和知识会爆炸性增长,知识的协作和管理会成为新的问题— —就像你有再多的先进坦克和战车,却因为无序的交通都堵在阿登森林了。 AI0 码力 | 111 页 | 11.44 MB | 8 月前3
共 4 条
- 1













