2023 中国开源开发者报告这自然要从 OpenAI 说起,前一年年底,ChatGPT 的横空出世,标志着对话式 LLM 开始进入公众视野,为人们提供了全新的人机交互方式。而 2023 年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新的台阶,为 LLM 的广泛应用奠定了基础。再之后的 11 月份,OpenAI 再发力,GPTs 的到来,“用户自定义 ChatGPT” 的能力,更是让世人领略了 OpenAI 翻了又翻。 ## 三、 Claude 2、PaLM 2、Llama 等模型与产品也展现了 LLM 在语言理解和多模态处理能力方面的探索,甚至 Claude 2 还一度被誉为实力可以硬刚 ChatGPT。而 Meta 开源的 Llama 2 更成为了 LLM 领域开源势力的典型代表,它的出现,犹如一颗投入平静湖面的石子,激荡起层层水波,“Llama 2 一开源,全球范围内进入了百模混战阶段”,这个说法一点也不为过。 本的基础上增加 AI 能力,使其智能化,但它的智能只充当了“辅助”角色;在 AI 原生的语境下,LLM 从一开始就是应用的中枢,应用本身的架构、功能、交互层是围绕 LLM 中枢来构建的。也许 ChatGPT 是最经典的“AI 原生”应用。此概念目前还处在萌芽期,明确的概念、应用场景、架构、技术栈细节等尚未完成自洽。换一种视角来看,这个概念的提出其实都没技术什么事,有人称之为“造商业概念”,这里按下不表。0 码力 | 87 页 | 31.99 MB | 2 年前3
Moonshot AI 介绍更重要的是理解两者之间的关系。 AGI 和产品对我们来说并不是手段和目的的关系,两个都是目的。同时,在追求 AGI 的过程中,我认为所谓的数据飞轮是很重要的,尽管它是一个老套的概念。 像 ChatGPT 这样的产品,还没有完全建立起基于用户数据的持续进化。我觉得这很大程度上是 base model 还在进化,进化了一代,之前的用户数据就没什么用了。这跟发展阶段有关系——现在“吃”的是 base 释性的?因为刚刚你也提到了模型是一个黑盒,并且其实人类到现在还没有弄清楚自己的大脑是怎么工作的。 杨植麟:可解释性核心是个信任的问题。建立一个信任的心智是很重要的,对应的应用场景甚至可能和 ChatGPT 的也会不同,比如 long-context 和搜索的结合。 当模型完全不 hallucinate 或者概率非常低,就不需要解释了,因为它说的东西都是对的。而且解释有可能也只是 alignment 第二点就在于 AI 的终极价值是个性化。 海外独角兽:OpenAI 其实也有一定的 long-context 了。 杨植麟:它还没有把用户的交互过程真正视为个性化的场景。比如,如果我们去 ChatGPT prompt 某个东西,不管是今天还是明天,只要模型版本相同,可能效果基本上差不多,这就是我说的缺乏个性化。 最终所有东西都是指令遵循。只不过你的指令会越来越复杂。今天你的指令一开始可能是 100 码力 | 74 页 | 1.64 MB | 2 年前3
2024 中国开源开发者报告我们先看大模型赛道的整体状况: 大模型是一项相对较新的技术。尽管 OpenAI 早在 2019 年就发布了第一个重要的模型 GPT-2,但大模型的广受关注实际始于 2022 年 11 月发布的 ChatGPT。8 个月以后 Meta 就与微软合作发布了开源大模型 LLaMA-2。这个赛道的主要玩家在技术和商业化上有差距,但没有到翻盘无望的程度。 大模型赛道不但包括模型的训练,也包括模型服务。训练是 术先进性”更多是用于公关宣传的素材。考虑到数据获取、加工的成本,模型训练的成本,这是一种相当昂贵的宣传方式。 C 端用户指那些把大模型当成智能个人助理来使用的普通个人用户。OpenAI 在 ChatGPT 上一个重要且成功的操作就是把大模型从学术界、工业界直接推向了普通个体,让 C 端用户切实感受到了大模型的可能性与魅力。这一点被国内的大模型厂商广泛学习。在 B 站刷视频,国内知名的那几个大模型厂商的广告,你一个也不会落下。 已从单一的辅助工具,逐渐演变为软件开发人员不可或缺的助手或伙伴。 除了前面已介绍的 Cursor、Composio SWE-Kit、OpenHands CodeAct 等工具之外,国内主要使用 chatGPT、GitHub copilot、通义灵码、CodeGeeX、文心快码、蚂蚁 CodeFuse 等编程工具,国外还出现一些受欢迎的、新的编程工具,如 Codeium IDE Cascade、Solver0 码力 | 111 页 | 11.44 MB | 1 年前3
共 3 条
- 1













