2024 中国开源开发者报告开源模型未必更先进,但会更长久 30 | 大模型撞上“算力墙”,超级应用的探寻之路 36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 大模型训练中的开源数据和算法:机遇及挑战 57 | 2024 年 AI 编程工具的进化 62 | AI 开发者中间件工具生态 2024 年总结 开发技术栈作为切入点,将深入探讨以下中国 AI 大模型领域的代表性开源项目社区。 这些开源项目社区覆盖了深度学习框架、向量数据库、AI辅 助编程、LLM 应用开发框架、模型微调、推理优化、LLM Agent,以及检索增强生成(RAG)等多个关键技术栈。 为了更全面客观地展示中国大模型 LLM 开发技术栈的开源 社区生态,我们使用了 对开源社区的生态评 估体系,希望通过这些数据洞察中国开源开发者在 AI 技术 领域的活跃度、生产力和创新能力。 无法持续更新的知识库,可以通过 RAG(Retrieval Augmented Generation,检索增强 生成)来解决。 RAG 的出现,让各界越来越深刻地认识到,大模型没必要存储那么多知识,只需要如何使 用搜索引擎这个外部工具即可。大模型可以在搜索结果上做进一步的信息筛选和优化,而搜索引 擎弥补了大模型的知识缺陷,实现了 1+1>=2 的效果。 RAG 可以被理解为智能体的最简单形0 码力 | 111 页 | 11.44 MB | 8 月前3
Moonshot AI 介绍能⼒也会显著下降,⼤量任务都⽆法胜任,就像未发育完全的蝌蚪。 其次,你可以让模型「问哪⼉看哪⼉」,就像只能在特定花蕊上采蜜的蜜蜂,⽆法关注到整体信息。 这通常是通过对上下⽂的降采样或者RAG(检索增强⽣成)⽅法来实现的,让模型只关注和问题直接 相关的部分,减少计算量。但如此⼀来,模型就⽆法回答那些需要基于全⽂理解来回答的问题(例如 从50个简历中对候选⼈的画像进⾏归纳和总结),能⼒⼤打折扣。 ⼒机制。模型⽆法对全⽂进⾏完整理解,⽆法处理跨⽂档的⽐较和⻓⽂本的综合理解(例如,⽆法从 ⼀篇10万字的⽤⼾访谈录⾳转写中提取最有价值的10个观点)。 “蜜蜂”模型,特点是只关注局部,忽略整体。通过对上下⽂的降采样或者RAG(检索增强的⽣ 成),只保留对部分输⼊的注意⼒机制。模型同样⽆法对全⽂进⾏完整理解(例如,⽆法从50个简历 中对候选⼈的画像进⾏归纳和总结)。 “蝌蚪”模型,特点是模型能⼒尚未发育完整。通过减0 码力 | 74 页 | 1.64 MB | 1 年前3
2023 中国开源开发者报告OpenHarmony 官方原生框架 ArkUI 之上扩展 的。 极速版 IDE 框架 CodeBlitz 开源! NebulaGraph 出席 DockerCon 2023 借助Graph + RAG的契机, NebulaGraph 在国际性技 术会议 DockerCon 同世界 的技术爱好者们分享了图 数据库同 LLM 结合之道。 34 / 87 1 1 Unity 引擎中国版“团结引擎”正式发布0 码力 | 87 页 | 31.99 MB | 1 年前3
共 3 条
- 1













