2024 中国开源开发者报告Augmented Generation,检索增强 生成)来解决。 RAG 的出现,让各界越来越深刻地认识到,大模型没必要存储那么多知识,只需要如何使 用搜索引擎这个外部工具即可。大模型可以在搜索结果上做进一步的信息筛选和优化,而搜索引 擎弥补了大模型的知识缺陷,实现了 1+1>=2 的效果。 RAG 可以被理解为智能体的最简单形式。未来的智能体可以实现多种工具的混合使用,甚 至多智能体 Haiku,大模型自身的能力不断提升,使得模型能够更好地理解和解 决复杂的编程问题。 智能体(AI agent)的引进:智能体可以收集和学习与任务相关的知识,可以直接调用静 态代码分析工具、直接调用搜索引擎和 API 为编程任务服务,并通过构建代码仓库知识图来帮 助大模型全面理解软件仓库的结构和依赖关系,从而更好地定位问题根源并生成有效的代码补丁。 智能体还可以动态获取代码片段和问题相关的信息,并分析和总结收集到的信息,以便规划 AI 从业者观察 因为我看到的不代表真相,所以这一章节会很短,仅仅分享两个发现。 (一)AI 技术的下坡 有两个感受(非证据)可以说明这一点。 (1)关于 AI 大模型的自媒体数量在减少,从搜索引擎趋势,加上我和几个业内朋友的 blog、 公众号以及 X 的阅读量下降趋势也可以佐证这一点,下半年虽然市场理性回归,但整体热度是 在下降的。OpenAI 不再持续放大招可能也是重要原因之一。0 码力 | 111 页 | 11.44 MB | 8 月前3
2020 中国开源年度报告
布图。在此,我们选择三个⼯作时间分布有明显特征的项⽬进⾏简单分析。 apache/carbondata,Apache CarbonData 是⼀种新的融合存储解决⽅案,利⽤先进 的列式存储、索引、压缩和编码技术提⾼计算效率,从⽽加快查询速度,其查询速度⽐ PetaBytes 数据快⼀个数量级。 apache/incubator-teaclave,⼀个开源的通⽤安全计算平台,使对隐私敏感的数 milvus-io/milvus,Milvus 为海量特征向量的近似最近邻搜索(ANNS)⽽设计。相⽐ Faiss 和 SPTAG 这样的算⼦库,Milvus 提供完整的向量数据更新,索引与查询框架。 Milvus 利⽤ GPU(Nvidia)进⾏索引加速与查询加速,能⼤幅提⾼单机性能。 odpi/egeria nnstreamer/nnstreamer,NNStreamer 是⼀组 Gstreamer0 码力 | 46 页 | 4.09 MB | 1 年前3
2023 中国开源开发者报告月发 布,可用于生产环境且向前兼容。1.0 的 CLI 工具不仅进入了稳定状态, 还新增了许多破坏兼容性的重要变化,使错误处理程序更加直观。 Meilisearch 是 Rust 实现的高性能开源搜索引擎,支持方便地集成到任何 网 站 或 应 用 程 序 , 支 持 自 托 管 (self-hosting) , 可 作 为 Algolia 和 Elasticsearch 的轻量替代方案。 硬核发版 MySQL 8.0.34,PolarDB-X 在读写混合场景上有 30~40% 的性能提升,可以作为开源 MySQL 的最佳替代选择。 5 倍提升,NebulaGraph v3.5.0 支持 UDF、重构索引 在年中发布的 v3.5.0 版本主要是优化了 FIND ALL PATH 性能,支持了 UDF 功能。其中,FIND ALL PATH 的深度性能有大约 50-500%的提升,其中 1 to 5 在向量数据库中进行高效的相似性计算和查询。 根据向量数据库的的实现方式,可以将向量数据库大致分为两类: 原生的向量数据库专门为存储和检索向量而设计, 所管理的数据是基于对象或数据点的向量表示进行 组织和索引。 包括 等均属于原生向量数据库。 除了选择专业的向量数据库,对传统数据库添加 “向量支持”也是主流方案。比如 等传 统数据库均已支持向量检索。 46 / 87 LLM 基础设施:向量数据库/数据库向量支持0 码力 | 87 页 | 31.99 MB | 1 年前3
使用Sphinx编写Web文档 - 陈照强https://www.sphinx-doc.org/en/master/examples.html Sphinx文档的优点 丰富的输出格式 完备的交叉引用 明晰的分层结构 美观的自动索引 … …. 精确的语法高亮 开放的扩展插件 多种丰富美观的主题 简单、方便 … …. Sphinx 为python社区的快速发展立下了汗马功劳 2 谁发明了Sphinx0 码力 | 17 页 | 1.69 MB | 1 年前3
2021 中国开源年度报告资料来源:公司公告,云启资本 104 Zilliz 的成功代表着基于 GPU 的大数据加速器为企业日益增长的数据分析需求提供了有效解决方案。 Zilliz 的核心项目向量相似度搜索引擎 Milvus 是全球首款 GPU 加速海量特征向量匹配和检索引擎。 Milvus 依托 GPU 加速,提供极速特征向量匹配以及多维度数据联合查询(特征、标签、图片、视 频、文本和语音等联合查询)功能,并且支持自动分库分表和多副本,能对接0 码力 | 132 页 | 14.24 MB | 1 年前3
Moonshot AI 介绍海外独⻆兽:沿着⼊⼝逻辑的话,你觉得未来会有⼏个⼊⼝? 杨植麟:⾄少有两个,⼀个是有⽤的,⼀个是好玩的。 信息⼊⼝可能不存在了,因为我们搜寻信息本质上是希望端到端完成⼀个任务。智能的⼊⼝以后⼤概 率会覆盖搜索引擎这类信息⼊⼝。⼈获取信息并不是终极需求,它只是⼀直被强⾏定义成⼀种需求。 有些时候我们是希望完成⼀件事,有些时候是希望学习某个东西,AGI的⼊⼝应该直接帮⽤⼾完成任 务,⽽不是帮他们获取信息。 万字的处理能⼒,同时它⽀持各类 ⽂档的解析功能,可以解析PDF、Excel、CSV等各种各样的格式,这些⽂档你都可以放进去,⼀次可 以放很多条。同时,在缺乏信息的时候,它会像⼈类⼀样去调⽤搜索引擎去看前五到前⼗个⽹⻚。因 为context⾮常⻓,所以它可以把所有的这些⽹⻚⾥的每⼀个细节都读完,⽽不是只是读⼀个摘要。 ⼤家会发现,有了超⻓上下⽂之后,⻓⽂档的解析和WebCopilot这两个功能⼏乎是⾮常直接,也⾮0 码力 | 74 页 | 1.64 MB | 1 年前3
2021 中国开源年度报告Partners Zilliz 的成功代表着基于 GPU 的大数据加速器为企业日益增长的数据分析需求提供了有效解 决方案。Zilliz 的核心项目向量相似度搜索引擎 Milvus 是全球首款 GPU 加速海量特征向量 匹配和检索引擎。Milvus 依托 GPU 加速,提供极速特征向量匹配以及多维度数据联合查询(特 征、标签、图片、视频、文本和语音等联合查询)功能,并且支持自动分库分表和多副本,能对0 码力 | 199 页 | 9.63 MB | 1 年前3
中国开源软件产业研究报告件的发行版,红帽提供二次开发、云计算、培训等服务形成收入,谷歌的Chrome浏览器本身不是开源软件,但谷歌开源 了这一浏览器的内核Chromium,基于这一内核二次开发的衍生浏览器均能够和谷歌的搜索引擎、邮件、地图等其他服务 形成良好的适配,谷歌公司的收入来源以广告为主,Chromium的开源帮助谷歌扩大了其产品生态的影响力,间接地帮助 谷歌确立了市场地位。红帽和谷歌的商业模式均能体现:开源软件0 码力 | 68 页 | 3.63 MB | 1 年前3
共 8 条
- 1













