AGI 趋势下的云原生数据计算系统OSC 源创会 · 上海站 · 第 104 期 AGI趋势下的云原生数据计算系统 演讲人:徐阳 ## 拓数派:大模型数据计算系统先行者 企业介绍 ● 拓数派(OpenPie)是立足于国内的基础数据计 算领域高科技创新机构; ● 拥有强大的数据库内核研发团队、数据科学家团队和数字化转型团队; ● 国内虚拟数仓和eMPP技术提出者,不断在数据 计算引擎方向进行创新,全面拥抱AI技术趋势。  ## 中国AGI发展趋势 中国AGI市场融资非常活跃,AGI顶级人才非常欠缺,整个市场将长期保持快速增长态势。  boundaries, AGI would be able to operate fully flexibly across disciplines and solve unfamiliar problems without retraining0 码力 | 340 页 | 12.14 MB | 1 年前5
清华大学 DeepSeek 从入门到精通2025年2月 • Deepseek是什么? • Deepseek能够做什么? · 如何使用Deepseek? ## DeepSeek是什么? - DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶0 码力 | 103 页 | 5.40 MB | 1 年前3
Moonshot AI 介绍本文还试图回答另一个外界普遍关心的问题:一家新创立的 AGI 公司如何超越 OpenAI?杨植麟的答案是 tech vision,一号位要能做出技术判断,同时还能拍板执行。一个具体的例子是,月之暗面希望比 OpenAI 更关心用户,原因是杨植麟判断用户数据的 scale up 的效果最终会超越 base model 自身。 杨植麟对于用 transformer 这个概率模型的思想基础走向 AGI 也很有信心,用他的话说 “如果你有 “如果你有 10 亿的 context length,今天看到的问题都不是问题”。 AGI:AI 本质就是一堆 scaling law 海外独角兽:我们把 LLM 的训练比作登月,月之暗面的名字也和登月相关。你怎么看现在创业公司的 LLM 训练,在 GPU 和算力资源有限的条件下,还能实现登月吗? 杨植麟:“登月”有几个不同的生产要素,算力肯定是一个核心,但还有其他的。 你需要一个同时满足 scalability 有多大,tech space 越大,技术、产品、商业层面能实现的差异化就越大。如果技术已经收敛了,那大家只能去追赶,就是同质化内卷。 然后我其实比较乐观,因为现在仍有巨大的 tech space。AGI 技术可以分为三层: 第一层是 scaling law 结合 next-token-prediction。这个基础对所有人都是一样的,追赶过程逐渐收敛。在这个路径上,OpenAI 现在做得更好,因为他们过去四五年投入了相应的资源。0 码力 | 74 页 | 1.64 MB | 2 年前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502体AI 从数字空间中的AI,走向能理解和操控物理空间的AI 从解决现实问题的AI,走向解决科学问题的科学型AI ## 面对全球大模型产业之争,要打赢「三大战役」 ## AGI之战 - 探索超越人类的超级人工智能AGI 不仅是科技之争,更是国运之争 - 不发展是最大的不安全,发挥举国体制优势,打赢追赶之战 ## 大模型安全之战 - 大模型带来前所未有安全挑战 - 外挂式传统安全手段难以应对 - 只有把大模型拉下神坛,让大模型走进千家万户、百行千业,才能掀起新一轮工业革命 ## DeepSeek出现之前 我们对大模型发展趋势的十大预判 ## DeepSeek出现之前的十大预判之一 传统AGI发展步伐在放慢 需要寻找新方向 全面超越人类的人工智能在逻辑上不成立 Scaling Law边际效应递减 人类训练数据接近枯竭 合成数据无法创造新知识 推理能力难以泛化,成本高昂 ## DeepSeek出现之前的十大预判 ➢ 预训练模型思考深度不够 算力见顶,变成少数巨头游戏 预训练大模型难以通往AGI之路 > 推理模型如R1——通过逻辑链条推导答案, > 分解规划,自我反思 ➢ 预训练范式像是记忆和模仿,强化学习范式更像探索实践 记住很多东西只是基础,真正有价值的是融会贯通 R1找到了人类通往AGI的方向 ## 推理能力获得突破的关键是学会了「慢思考」 快思考 慢思考 例:课堂提问0 码力 | 76 页 | 5.02 MB | 1 年前3
普通人学AI指南## 普通人学 AI 指南 作者:郭震 日期:2024年6月8日 ## Contents 1 AI 大模型基础 ..... 4 1.1 AIGC ..... 4 1.2 AGI ..... 5 1.3 大模型 ..... 5 1.4 基础概念 ..... 6 1.4.1 上下文窗口 ..... 6 1.4.2 单位 B 和 T ..... 6 2 AI 工具梳理 描述相符的内容。下图 1 描述了 AI 大模型,AIGC 和 AGI 关系。  Figure 1: AI 大模型,AIGC 和 AGI 关系 ### 1.2 AGI AGI(Artificial General Intelligenc Intelligence,人工通用智能)是一种理论上的人工智能,它可以理解、学习和应用知识跨越各种不同领域,功能上等同于人类智能。 与专用人工智能(AI)不同,AGI 能够执行任何智力任务,具备自我意识和自适应学习能力。AGI 的研发目标是创造出可以广泛地模拟人类认知能力的智能系统。 ### 1.3 大模型 大模型通常指的是大规模的人工智能模型,这类模型通过训练大量的数据来获得广泛的知识和能力。这些模型通常具有庞0 码力 | 42 页 | 8.39 MB | 1 年前3
Claude Opus 4.7 System Card 中文版Agent 64.4% 60.1% 57.2% 61.5% 59.7% MCP-Atlas 77.3% 75.8% 68.1% - 73.9% ARC-AGI-1 92.0% 93.0% 93.7% 94.5% 98.0% ARC-AGI-2 75.83% 68.8% 73.3% 83.3% 77.1% 表8.1.A能力评估总览。除特别说明外,所有Claude Opus4.7结果均使用 and Real-world Tasks 本章涵盖Claude Opus4.7在多模态理解(视觉推理、图表理解、GUI定位、计算机使用)、真实世界专业任务(办公文档、金融、工具使用、商业模拟)、ARC-AGI流体智力、多语言能力及生命科学领域的评估结果。 8.9 多模态 Multimodal Claude Opus 4.7支持的最大图像分辨率为单维最大2576px、总计最多3.75MP。先前模型(包括Claude 11 ARC-AGI ARC-AGI ARC-AGI是ARC Prize Foundation开发的流体智力基准。它旨在衡量AI模型仅给出少量(通常2-3个)示例就能推理新模式的能力。模型获得满足某种隐藏关系的输入-输出网格对,任务是推断新输入网格的对应输出。基准有两个变体:ARC-AGI-1和ARC-AGI-2。(ARC Prize Foundation还有一个不同的ARC-AGI-3基准,在本0 码力 | 128 页 | 9.92 MB | 1 月前3
清华大学第二弹:DeepSeek赋能职场同时,考虑到文案效果,包含这些关键词或短语:【内卷】【躺平】【AGI】。现在,请根据你对平台特性的认识,编写一段简洁、明了且能够引发用户好奇心的文案。  ## 8 已深度思考(用时 15 秒) ## 标题 “卷王舍友在图书馆通宵?我靠AGI把论文写成SCI,躺平拿下国奖后导师求我开课!” 奖后导师求我开课!” ## 正文 还在为DDL焦虑到秃头? 当室友还在图书馆边哭边查重时,我偷偷用AI工具5分钟水完文献综述—— 现在!零门槛AGI写作工作坊免费开放,手把手教你用魔法打败学术内卷! ✓ 为什么你要立刻点击报名? 【零门槛学习】 “代码?编程?达咩!”纯小白专属保姆教程,从ChatGPT到Claude实战教学 附赠《让AI跪着改稿的20条魔鬼咒语》电子版 【躺平#摆烂】 自动生成答辩Q&A话术 ✓ 把课程论文包装成期刊格式 ✓ 用AI做数据分析可视化 💡学会这些黑科技,你卷任你卷,我笑看DDL ## 【免费薅名校羊毛】 限时开放100个席位(教授私藏的AGI工具包白送!) 结课赠送《AI学术裁缝进阶指南》(教你缝合出导师狂夸的优质论文) ## 今日暗号 评论区扣【求捞】获取报名通道 前30名加送《反卷青年专用糊弄学话术》★专治画饼导师/凡尔赛同学0 码力 | 35 页 | 9.78 MB | 1 年前3
2024 中国开源开发者报告大模型撞上“算力墙”,超级应用的探寻之路 ## 文/傅聪 近日,大模型教父 Sam Altman 在 Reddit 上的评论透露出 GPT-5 难产的隐忧,直言有限的算力约束让 OpenAI 面临迭代优先级的艰难抉择,在通往 AGI 的道路上一路高歌猛进的领头羊似乎撞上了“算力墙”。 除此之外,能耗、资金,难以根除的幻觉,有限的知识更新速率、有限的上下文宽度、高昂的运营成本等等,都让外界对大模型的发展忧心忡忡。面对棘手的困境与难题,大模型的未来,又该何去何从呢? representation spaces.  正 AGI 的必经之路。将多模态信号统一对齐,是智能体与这个世界“无障碍”交互的前提,换个新潮的词汇,就是我们期待的“具身智能”。谁不想拥有一台自己专属的“Javis”呢?而多模态大模型的突破,也同样依赖前文所述的算力和数据上的沉淀。 就像今天的基层程序员, 需要人表达清楚需求才能做好, 复杂系统的架构设计和问题解决也还是要靠人。 专业模型是通向 AGI 的必经之路。Anthropic CEO 预测,未来 5 年专业模型将达到人类顶尖专家水平,将人类科研进展加速 10 倍,15 年后人类寿命有望达到 150 岁。但 AGI 能否实现,最大的不确定性在于技术和资金。 ## × Contents Basic assumptions0 码力 | 111 页 | 11.44 MB | 1 年前3
DeepSeek-V2: A Strong, Economical, and Efficient
Mixture-of-Experts Language Modelundergone rapid development, offering a glimpse into the dawn of Artificial General Intelligence (AGI). In general, the intelligence of an LLM tends to improve as the number of parameters increases, allowing the paper. DeepSeek believes that innovation, novelty, and curiosity are essential in the path to AGI. ### B. DeepSeek-V2-Lite: A 16B Model Equipped with MLA and DeepSeekMoE #### B.1. Model Description0 码力 | 52 页 | 1.23 MB | 2 年前3
共 22 条
- 1
- 2
- 3
相关搜索词
AGI云原生数据计算系统AIGC向量计算引擎大模型人工智能AI模型AI应用AI风险DeepSeek推理模型通用人工智能(AGI)TASTE框架ALIGN框架长上下文AI技术Kimi智能助手开放平台创业机会企业应用个人生产力LLaMA3参数Token上下文窗口Billion(B)Claude Opus 4.7System Card多模态负责任扩展政策安全护栏提示语技巧多场景应用新媒体文案开源开发者开源模型Gitee开源社区Multi-head Latent Attention (MLA)DeepSeekMoEMixture-of-Experts (MoE)Transformer architecturetraining efficiency













