大模型 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

开源中国 2023 大模型(LLM)技术报告

LLM 技术报告大语言模型（LLM）技术作为人工智能领域的一项重要创新在今年引起了广泛的关注。 LLM 是利用深度学习和大数据训练的人工智能系统，专门设计来理解、生成和回应自然语言。这些模型通过分析大量的文本数据来学习语言的结构和用法，从而能够执行各种语言相关任务。以 GPT 系列为代表，LLM 以其在自然语言处理领域的卓越表现，成为推动语言理解、生成和应用的引擎。 LLM LLM 在多个领域都取得了令人瞩目的成就。在自然语言处理领域，GPT 系列模型在文本生成、问答系统和对话生成等任务中展现出色的性能。在知识图谱构建、智能助手开发等方面，LLM 技术也发挥了关键作用。此外，它还在代码生成、文本摘要、翻译等任务中展现了强大的通用性。本报告从技术人视角出发，将深入探讨 LLM 技术的背景、基础设施、应用现状，以及相关的工具和平台。 2 / 32 LLM Tech Tech Map  向量数据库  数据库向量支持  大模型框架、微调 (Fine Tuning)  大模型训练平台与工具基础设施 LLM Agent  备案上线的中国大模型  知名大模型  知名大模型应用大模型算力工具和平台  LLMOps  大模型聚合平台  开发工具 AI 编程  插件、IDE、终端  代码生成工具编程语言 3 / 32

0 码力 | 32 页 | 13.09 MB | 1 年前
3
清华大学 DeepSeek 从入门到精通

DeepSeek是什么？ AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，当人人都会用AI时，你如何用得更好更出彩？推理模型 • 例如：DeepSeek-R1，GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。推理大模型：推理大模型是指能够在传统的大语言模型基础上，强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术，比如强化学习、神经符号推理、元学习等，来增强其推理和问题解决能力。非推理大模型：适用于大多数任务，非推理大模型一般侧重于语言生成、上下文理解和自然语言处理，而不强解和自然语言处理，而不强调深度推理能力。此类模型通常通过对大量文本数据的训练，掌握语言规律并能够生成合适的内容，但缺乏像推理模型那样复杂的推理和决策能力。维度推理模型通用模型优势领域数学推导、逻辑分析、代码生成、复杂问题拆解文本生成、创意写作、多轮对话、开放性问答劣势领域发散性任务（如诗歌创作）需要严格逻辑链的任务（如数学证明）性能本质专精于逻辑密度高的任务擅长多样性高的任务

0 码力 | 103 页 | 5.40 MB | 8 月前
3
清华大学第二弹：DeepSeek赋能职场

For Culture & Art 文、图、乐、剧 Innovator For Social 智能角色交互体 Innovator For Science & Industry 行业大模型基座大模型人机协同 Chatbot •自然语言对话 Reasoner •基本的推理和问题解决能力 Agent •代表用户执行任务，具备自主行动能力 Innovator • 参与发明和创造， • 致力于人机协同和人机共生领域的世界级团队，专注于打造能够驾驭AI、熟悉AI并实现人类与AI共生发展的学术与实践模式。团队愿景 • 李默非（清华大学人工智能学院拟录博士生）：人机共生之基座大模型研究研发 • 何静（清华博士后、北航助理教授）：人机共生之快生引擎研究研发 • 尤可可（清华博士后、北石化助理教授）：人机共生之AIGC短视频 • 安梦瑶（清华大学博士后）：人机共生之AI诊疗研究 • 章艾媛（清华大学博士生）：人机共生之数据分析 • 邹开元（清华大学博士生）：人机共生之文学内容创作 • 向安玲（清华博士后、中央民大助理教授）：人机共生之AI数据分析领域 • 马绪峰（清华博士后、同济大学助理教授）：人机共生之文化艺术创作成员及核心研究方向赛事奖项 2024 “AI4S Cup LLM 挑战赛” 大模型科学文献分析赛道一等奖 2024 Kaggl e The Learni ng Agency Lab

0 码力 | 35 页 | 9.78 MB | 8 月前
3
2024 中国开源开发者报告

TOP101-2024 大模型观点编委会 21 | 2024 年中国开源模型：崛起与变革 26 | 开源模型未必更先进，但会更长久 30 | 大模型撞上“算力墙”，超级应用的探寻之路 36 | AI 的三岔路口：专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024：随需而变，从狂热到理性 51 | 大模型训练中的开源数据和算法：机遇及挑战开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中的「开发工具与环境」 98 | 推理中心化：构建未来 AI 基础设施的关键高瞻，Gitee AI 运营设计：张琪开发者是开源生态的重要支柱。本章结合、的数据分析，勾勒 2024 年中国开源开发者的整体画像趋势轮廓，主要反映中国开源开发者使用开源大模型概况、开源项目/组织健康度，以及中国开源社区的生态评估等情况。 Gitee 数据篇本报告数据来源：2024年1月至2024年12月 Gitee及Gitee AI平台相关公开数据 4 / 111

0 码力 | 111 页 | 11.44 MB | 8 月前
3
2023 中国开源开发者报告

1 1 /*使用电脑阅读，获得最佳体验 1 1 序毫无疑问，开源开发者圈子来看，2023 年是大模型 LLM 年、生成式 AI GenAI 年。一、这自然要从 OpenAI 说起，前一年年底，ChatGPT 的横空出世，标志着对话式 LLM 开始进入公众视野，为人们提供了全新的人机交互方式。而 2023 年 3 月，同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 Google 紧随其后推出 Bard，作为其首次亮相的对话 LLM 产品，无疑具有其里程碑意义，尽管它的首秀并不尽如人意，车翻了又翻。三、 Claude 2、PaLM 2、Llama 等模型与产品也展现了 LLM 在语言理解和多模态处理能力方面的探索，甚至 Claude 2 还一度被誉为实力可以硬刚 ChatGPT。而 Meta 开源的 Llama 2 更成为了 LLM 领域开源势力的典型代表，它的 Gemini 与“磁力链开源” Mistral 8x7B 两大神作，也凭借不输 GPT-4 的实力，将 LLM 狂潮卷到天际。四、 Stable Diffusion 和 Midjourney 这两大图像生成系统的出现，极大地拓展和加速了 LLM 在计算机视觉领域的应用，它们突破了传统图像生成方式的局限，仅需要用户提供文字描述，就可以生成高质量的数字艺术作品。它们的图像生成质量、样

0 码力 | 87 页 | 31.99 MB | 1 年前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

AI能帮助人解决登陆火星、能源自由的问题 5政企、创业者必读大模型是真智能，是人工智能的重大拐点。你相不相信？大模型是一场工业革命，将重塑所有产品和业务。你相不相信？不拥抱AI的组织和个人，会被拥抱AI的组织和个人淘汰。你相不相信？建立AI信仰 6政企、创业者必读大模型不是泡沫，而是新一轮工业革命的驱动引擎蒸汽革命电气革命信息革命以大模型为代表的人工智能革命人工智能是新质生产能大模型的进一步突破将引领人类社会进入智能化时代，对我们的生活方式、生产方式带来巨大变革重塑经济图景解决复杂问题 7政企、创业者必读 8 AI不仅是技术革新，更是思维方式和社会结构的变革国家产业个人企业政企、创业者必读人工智能发展历程（一）  从早期基于规则的专家系统，走向基于学习训练的感知型AI  从基于小参数模型的感知型AI，走向基于大参数模型的认知型AI 人工智能发展历程（二）  从单纯对话的大模型AI，发展到具有行动和执行能力的智能体AI  从数字空间中的AI，走向能理解和操控物理空间的AI  从解决现实问题的AI，走向解决科学问题的科学型AI 大模型AI 智能体AI 物理AI 科学AI 10政企、创业者必读面对全球大模型产业之争，要打赢「三大战役」 AGI之战应用场景之战大模型安全之战 • 探索超越人类的超级人工智能AGI

0 码力 | 76 页 | 5.02 MB | 5 月前
3
普通人学AI指南

Contents 1 AI 大模型基础 4 1.1 AIGC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.2 AGI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.3 大模型 . . . . . . . . . . . . . . . 12 2.5.6 Snack Prompt . . . . . . . . . . . . . . . . . . . . . . . . 12 2.6 AI 大模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.6.1 AgentGPT . . . . . . . . . 13 2.6.4 Llama3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3 零代码本地部署 AI 后端 13 3.1 大模型 Llama3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3.1.1 步骤 1：安装 Ollama . . . . .

0 码力 | 42 页 | 8.39 MB | 8 月前
3
DeepSeek图解10页PDF

. . . . . . . . . . . 7 3.1.1 核心创新 1：含 R1-Zero 的中间推理模型 . . . . . . . 8 3.1.2 核心创新 2：通用强化学习 . . . . . . . . . . . . . . . 8 3.2 含 R1-Zero 的中间推理模型训练过程 . . . . . . . . . . . . . . 9 3.3 通用强化学习训练过程 . . . . . . . . . 11 1 1 本地部署并运行 DeepSeek 1.1 为什么要在本地部署 DeepSeek 在本地搭建大模型（如 DeepSeek）具有多个重要的优势，比如： 1. 保护隐私与数据安全。数据不外传：本地运行模型可以完全避免数据上传至云端，确保敏感信息不被第三方访问。 2. 可定制化与优化。支持微调（Fine-tuning）：可以根据特定业务需求对模离线运行，适用于无网络环境。可在离线环境下运行：适用于无互联网连接或网络受限的场景。提高系统稳定性：即使云服务宕机，本地大模型依然可以正常工作，不受外部因素影响。本教程搭建 DeepSeek 好处本地搭建 DeepSeek 三个比较实际的好处： • 本教程接入的是 DeepSeek 推理模型 R1，开源免费，性能强劲 • 本教程搭建方法零成本，不需花一分钱。 • 为了照顾到大部分读者，推荐的搭建方法已将电脑配置要求降

0 码力 | 11 页 | 2.64 MB | 8 月前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

本质：以多agent实现从数据采集到可视全流程模型特点 Claude 3.5 sonnet  平衡性能：在模型大小和性能之间取得平衡，适合中等规模任务。  多模态支持：支持文本和图像处理，扩展应用场景。  可解释性：注重模型输出的可解释性和透明性。 DeepSeek R1  高效推理：专注于低延迟和高吞吐量，适合实时应用。  轻量化设计：模型结构优化，资源占用少，适合边缘设备提供高精度结果。  长文本处理：擅长处理长文本和复杂文档，适合专业场景。  定制化能力：支持用户自定义训练和微调，适应特定需求。 Open AI o3 mini  小型化设计：轻量级模型，适合资源有限的环境。  快速响应：优化推理速度，适合实时交互场景。  通用性强：适用于多种自然语言处理任务，如对话生成和文本理解。爬虫数据采集 1、阅读网页源代码，提取特定网页内容； 5支持联网查询网址，Claude 3.5 sonnet暂不支持；  四个模型均能根据上传的网页代码，对多个网址链接进行筛选、去重，完全提取出符合指令要求的所有网址链接并形成列表；  在复杂爬虫任务上，DeepSeek R1与Open AI o3min生成的代码均能正常执行数据采集任务，o3响应速度更快，R1数据采集结果更加完整准确；其他2个模型都存在多次调试但代码仍然运行不成功的问题，如代码中罗列URL不全、输出文本中提取数据为空等。

0 码力 | 85 页 | 8.31 MB | 8 月前
3
网易数帆领先的数字化转型技术与服务提供商 2021

企业服务品牌，定位于领先的数字化转型技术与服务提供商，为客户提供创新、可靠的国产软件基础平台产品及相应技术服务，业务覆盖云原生基础软件、数据智能全链路产品、人工智能算法应用三大领域，旗下拥有轻舟、有数、易智三大产品线，致力于帮助客户搭建无绑定、高兼容、自主可控的创新基础平台架构，快速应对新一代信息技术下实现数字化转型的需求。网易数帆依托网易二十余年互联网技术积累，系列软件基础平台产品和技《Gartner 2020 中国 ICT 技术成熟度曲线》数据中台领域标杆厂商信通院“大数据'星河'案例-行业大数据应用优秀案例” 信通院 OSCAR 尖峰开源创新（二次开发）奖云计算开源产业联盟云原生十大优秀案例 infoQ 中国技术力量年度榜单 InfoQ2020 最有价值技术团队 InfoQ2020 最佳技术社区驱动力奖思否 SegmentFault 中国技术品牌影响力企业 DTCC 第十一届中国数据库技术大会创新产品奖注册发现服务治理服务路由流量染色服务化将企业能力转化为数字化的服务，打破企业软件应用中数据孤岛等现状。敏捷通过小步快跑的方式敏捷迭代，不断适应市场与业务需求的变化，摆脱缓慢的大版本更新与业务需求脱节的窘境。高效通过自动化与生产协作方式的优化，多环节提升软件生产的效率。开放基于开放的技术体系，打造开放的软件架构。轻舟云原生软件生产力平台 2.0 能力全景图

0 码力 | 43 页 | 884.64 KB | 1 年前
3

共 191 条前往

页

分类

语言

格式

开源中国 2023 大模型(LLM)技术报告

清华大学 DeepSeek 从入门到精通

清华大学第二弹：DeepSeek赋能职场

2024 中国开源开发者报告

2023 中国开源开发者报告

【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

普通人学AI指南

DeepSeek图解10页PDF

清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

网易数帆领先的数字化转型技术与服务提供商 2021