2024 中国开源开发者报告
Augmented Generation,检索增强 生成)来解决。 RAG 的出现,让各界越来越深刻地认识到,大模型没必要存储那么多知识,只需要如何使 用搜索引擎这个外部工具即可。大模型可以在搜索结果上做进一步的信息筛选和优化,而搜索引 擎弥补了大模型的知识缺陷,实现了 1+1>=2 的效果。 RAG 可以被理解为智能体的最简单形式。未来的智能体可以实现多种工具的混合使用,甚 至多智能 虚拟外教已经可以媲 美真人外教,由于发音标准,效果甚至超过大多数国内英语老师。 专业模型是通用大模型和垂直领域数据、工作流的结合。这里通用大模型的基础能力是关键, 一个世界领先的通用大模型加上 RAG(搜索增强生成)行业知识库,做出的专业模型效果往往 超过开源模型加上一些垂直领域数据微调得到的行业模型。因此,专业模型虽然训练、推理成本 都较高,但考虑到较高的溢价空间,投入是值得的。 由于通用大模 Haiku,大模型自身的能力不断提升,使得模型能够更好地理解和解 决复杂的编程问题。 智能体(AI agent)的引进:智能体可以收集和学习与任务相关的知识,可以直接调用静 态代码分析工具、直接调用搜索引擎和 API 为编程任务服务,并通过构建代码仓库知识图来帮 助大模型全面理解软件仓库的结构和依赖关系,从而更好地定位问题根源并生成有效的代码补丁。 智能体还可以动态获取代码片段和问题相关的信息,并分析和总结收集到的信息,以便规划0 码力 | 111 页 | 11.44 MB | 8 月前3Moonshot AI 介绍
司致⼒于 寻求将能源转化为智能的最优解,通过产品与⽤⼾共创智能,实现普惠AI。 • 成⽴时间:2023年3⽉1⽇ • 产品 ◦ Kimi智能助⼿(⽹⻚版:kimi.ai、App和⼩程序搜索“Kimi智能助⼿”即可),发布时间 2023年10⽉9⽇ ◦ MoonshotAI开放平台(公测中https://platform.moonshot.cn/),发布时间2023年11⽉2⽇ 能助⼿”,⼿机上的App和⼩程序都会更新为“Kimi智 能助⼿”,电脑上输⼊kimi.ai就能快速进⼊⽹⻚版。之前的名字KimiChat就不再使⽤了。 【功能亮点】 • 智能搜索:搜索实时信息,迅速整合,给出详尽回答,并提供搜集到的信息来源,让对话兼具丰富 性和准确性。 • ⾼效阅读:⻓⽂快速摘要,打破语⾔壁垒,帮你精准理解⽂献书籍、⻓篇报告、复杂合同、⽹⻚⻓ ⽂,提供深⼊洞察和分析。 语 ⾔,帮助你学习编程、解决技术问题。 • ⾃媒体与内容创作者:学习特定公众号、⽂件、⽹⻚链接的⻛格,辅助创作;快速搜集创作所需信 息,提供丰富的资料与灵感。 • ⾦融和咨询分析师:通过即时搜索,帮你第⼀时间掌握⾏业动态和市场信息,并提供洞察与分析。 • 法律从业⼈员:⾼效处理⼤量案件资料、整理证据、梳理法律政策,协助你撰写法律⽂书和报告, 提升⼯作效率。 专访⽉之暗⾯杨植麟:los0 码力 | 74 页 | 1.64 MB | 1 年前32021 中国开源年度报告
间竞争 资料来源:VansonBourne,云启资本 围绕这个问题以亚马逊网络服务 (AWS) 与 Elastic 的争论为例。Elasticsearch 是 Elastic 公司旗 下的一款搜索和数据分析引擎,采用 OpenCore 的商业模式。AWS 在它的下游开了一个发行版叫 OpenDistro for Elasticsearch。2021 年 1 月,Elastic 公司宣布即将变更 和竞争优势在于软件的 运维,那么可以选择 SaaS 作为商业模式。但是要面对公共云厂商竞争的潜在风险。 不是所有开源软件都适合做商业化。根据对美国开源独角兽公司的相应研究,发现大数据、AI、企业搜索、 中间件和操作系统这几个领域相对是容易商业化的。相反一些前端的控件,关注度很高,但是很难设置 收费点,商业化会有难度。因此成功的开源公司有成熟的商业模式,并且通常在美国有对标的项目。 资料来源:公司公告,云启资本 5.3 Jina AI Jina 首创的“神经搜索”,可以让企业利用可操作的非结构化数据构建搜索解决方案,做出更有效的业 务决策。Jina AI 的核心项目在 Github 上被称为 Jina ,允许用户在短短几分钟内创建一个由深度学习 驱动的云原生搜索解决方案。Jina 将构建一个生产就绪的神经搜索系统的工作量从几个月减少到几分钟, 非常适合需要快速、轻量级开发周期的商业环境。除了主产品0 码力 | 132 页 | 14.24 MB | 1 年前32023 中国开源开发者报告
一哥的宏大叙事能力与强劲技术实力。 二、 New Bing(Bing AI)代表了微软在 LLM 领域的野心和 决心,它首次把当时世人能想到最有价值又可行的 LLM 应用场景——“智能对话+联网搜索”——无缝整合了起来, 大有干掉搜索行业和问答社区的趋势,而后事实证明,全 球 最 强 IT 问 答 社 区 Stack OverFlow 深 受 其 害 。 Google 紧随其后推出 Bard,作为其首次亮相的对话 15 日,由 OpenAI 前成员创立的 Anthropic 发布对话 AI 产品 Claude,包含 520 亿个参数。 与 ChatGPT 类似,Claude 能够执行各种基于文字对话的任务,如文档搜索、 摘要、写作、编码,以及响应用户的提问。 四个月后,Anthropic 推出 Claude 2。Claude 2 改进了性能,响应时间更长, 可通过 API 访问。此外还上线了面向公众的 beta 月发 布,可用于生产环境且向前兼容。1.0 的 CLI 工具不仅进入了稳定状态, 还新增了许多破坏兼容性的重要变化,使错误处理程序更加直观。 Meilisearch 是 Rust 实现的高性能开源搜索引擎,支持方便地集成到任何 网 站 或 应 用 程 序 , 支 持 自 托 管 (self-hosting) , 可 作 为 Algolia 和 Elasticsearch 的轻量替代方案。 硬核发版0 码力 | 87 页 | 31.99 MB | 1 年前32021 中国开源年度报告
VansonBourne, Yunqi Partners 围绕这个问题以亚马逊网络服务 (AWS) 与 Elastic 的争论为例。Elasticsearch 是 Elastic 公司旗下的一款搜索和数据分析引擎,采用 OpenCore 的商业模式。AWS 在它的 下游开了一个发行版叫 OpenDistro for Elasticsearch。2021 年 1 月,Elastic 公司宣布 potential risk of competition from public cloud vendors. 不是所有开源软件都适合做商业化。根据对美国开源独角兽公司的相应研究,发现大数据、AI、 企业搜索、中间件和操作系统这几个领域相对是容易商业化的。相反一些前端的控件,关注度 很高,但是很难设置收费点,商业化会有难度。因此成功的开源公司有成熟的商业模式,并且 通常在美国有对标的项目。 Not Partners 5.3 Jina AI Jina 首创的“神经搜索”,可以让企业利用可操作的非结构化数据构建搜索解决方案,做出更 有效的业务决策。Jina AI 的核心项目在 Github 上被称为 Jina ,允许用户在短短几分钟内创 建一个由深度学习驱动的云原生搜索解决方案。Jina 将构建一个生产就绪的神经搜索系统的工 作量从几个月减少到几分钟,非常适合需要快速、轻量级开发周期的商业环境。除了主产品0 码力 | 199 页 | 9.63 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
RocketMQ RabbitMQ Elastiscearch API网关 API Gateway 轻舟微服务 全链路应用监控 APM 服务拓扑 链路追踪 日志服务 LogSeer 搜索检查 监控分析 应用 Spring Clould Dubbo Service Mesh 分布式事务 GTXS TCC 事务消息 事务轨迹 认证鉴权 发布管理 流量控制 协议转换 微服务框架 多媒体内容进行基础识别与解析,获得离散的内容表示信息。 综合内容理解 基于离散的内容解析结果,结合领域知识和多模态融合技术, 综合分析与推理获取内容的层次化语义描述及统计分析信息, 提高运营管理效率与内容搜索推荐效果。 字幕制作工具 支持识别中文、英文、中英混合的视音频内容,并自动生成字幕 文字和时间轴信息。自带翻译功能,可一键生成中英双语字幕。 广泛应用于视频字幕制作、英文视频学习等场景。 语音转写工具 别、视频标签等计算机视觉能力。可应 用于安全审核和监管、电商平台运营、 身份验证等场景。 自然语言处理 提供对话平台、文本纠错、文本生成、短 文本相似度等自然语言处理能力。可应 用于客服对话机器人、搜索、舆情分析 等场景。 23 SOLUTIONS 解决方案篇 SOLUTIONS 核心能力共享 构建服务共享中心,解决企业信息系统孤岛问题。 产品快速创新 快速响应需求变化,提升企业业务创新速度。0 码力 | 43 页 | 884.64 KB | 1 年前3中国开源软件产业研究报告
软 件的发行版,红帽提供二次开发、云计算、培训等服务形成收入,谷歌的Chrome浏览器本身不是开源软件,但谷歌开源 了这一浏览器的内核Chromium,基于这一内核二次开发的衍生浏览器均能够和谷歌的搜索引擎、邮件、地图等其他服务 形成良好的适配,谷歌公司的收入来源以广告为主,Chromium的开源帮助谷歌扩大了其产品生态的影响力,间接地帮助 谷歌确立了市场地位。红帽和谷歌的商业模式均能体现:开源软 981 1041 112 170 198 200 215 231 141 170 217 58 89 131 FY2018 FY2019 FY2020 谷歌搜索及其他广告(亿美元) YouTube广告(亿美元) 会员广告收入(亿美元) 其他服务收入(亿美元) 谷歌云(亿美元) 红帽公司的主要收入来自于对开源的Linux及其他云基础软件的发 行版订阅收入和配套服务。0 码力 | 68 页 | 3.63 MB | 1 年前3Gitea,新一代的代码托管平台
并代码提交、管理协作者、 管理分支等。支持标签、Cherry-pick、WebHook、集成协作工具等。 在线编辑 在线浏览和编辑源代码、配置文件、文档等,无需安装任何软件或插件。内 置文本搜索、代码高亮、自动补全、代码折叠等。 Gitea 核心能力:分支管理 分支保护 设置对分支的访问权限,并限制对该分支的操作。 分支管理 查看所有的分支,比较不同分支的差异,并支持创建、删除或合并分支。0 码力 | 30 页 | 14.34 MB | 1 年前3全球开源发展态势洞察(2023年第八期)
v5.14.0发布,版本特性更新 如下: • 各语言源码构建包版本升级; • 支持一键删除应用及应用下相关资源; • 使用集群命令行创建的pod有合理的回收机 制; • 域名配置https证书时,增加搜索功能或优 先匹配与域名相同的证书; • 支持配置日志存储路径。 近日,Prometheus v2.44.0发布,版本特性更 新如下: • 将每次发送的默认样本数提高到2000; • 支持处理原生直方图数据;0 码力 | 22 页 | 1.99 MB | 1 年前32020 中国开源年度报告
我们统计了 LF AI&Data 项⽬仓库的⼯作时间情况,为每个仓库绘制了图表。在此,我们选择 3 个项⽬进⾏分析。 milvus-io/milvus,Milvus 为海量特征向量的近似最近邻搜索(ANNS)⽽设计。相⽐ Faiss 和 SPTAG 这样的算⼦库,Milvus 提供完整的向量数据更新,索引与查询框架。 Milvus 利⽤ GPU(Nvidia)进⾏索引加速与查询加速,能⼤幅提⾼单机性能。0 码力 | 46 页 | 4.09 MB | 1 年前3
共 10 条
- 1