开源中国 2023 大模型(LLM)技术报告李泽辰,Gitee 主编 李涛,APUS董事长兼CEO 2023年12月发布 设计:张琪 ## LLM 技术报告 大语言模型(LLM)技术作为人工智能领域的一项重要创新在今年引起了广泛的关注。 LLM 是利用深度学习和大数据训练的人工智能系统,专门设计来理解、生成和回应自然语言。这些模型通过分析大量的文本数据来学习语言的结构和用法,从而能够执行各种语言相关任务。以 GPT 系列为代表,LLM 以其 以其在自然语言处理领域的卓越表现,成为推动语言理解、生成和应用的引擎。 LLM 在多个领域都取得了令人瞩目的成就。在自然语言处理领域,GPT 系列模型在文本生成、问答系统和对话生成等任务中展现出色的性能。在知识图谱构建、智能助手开发等方面,LLM 技术也发挥了关键作用。此外,它还在代码生成、文本摘要、翻译等任务中展现了强大的通用性。 本报告从技术人视角出发,将深入探讨 LLM 技术的背景、基础设施、应用现状,以及相关的工具和平台。 ## LLM Tech Map ## 大模型 ➢ 备案上线的中国大模型 知名大模型 知名大模型应用 LLMOps 大模型聚合平台 ## 工具和平台 ➢ 开发工具 插件、IDE、终端代码生成工具 ## AI 编程 ## 算力 ## 基础设施 向量数据库 数据库向量支持 ➢ 大模型框架、微调 (Fine Tuning) ➢ 大模型训练平台与工具 ## LLM Agent0 码力 | 32 页 | 13.09 MB | 2 年前3
AI大模型千问 qwen 中文文档AI agent, etc. 最新版本 Qwen1.5 有以下特点: • 6 种模型规模,包括 0.5B、1.8B、4B、7B、14B 和 72B; - 针对每种尺寸提供基础模型和 Chat 模型,并确保聊天模型按照人类偏好进行校准; • 对基础模型和 Chat 模型的多语言支持 - 基础模型和聊天模型都支持多种语言; - 支持工具调用、RAG(检索增强文本生成)、角色扮演、AI Agent 微信群。很期待见到你们! ## 文档 ### 1.1 安装 要快速上手 Qwen1.5,您可以从 Hugging Face 安装 transformers 库,并使用 Qwen1.5 Collection 中的模型。我们建议您安装最新版本的 transformers 库,或者至少安装 4.37.0 版本。 #### 1.1.1 Pip 安装 pip install transformers -U #### 我们建议您首先尝试使用 transformers 进行推理。请确保已安装了 transformers>=4.37.0 版本。以下是一个非常简单的代码片段示例,展示如何运行 Qwen1.5-Chat 模型,其中包含 Qwen1.5-7B-Chat 的实例: from transformers import AutoModelForCausalLM, AutoTokenizer device = "cuda"0 码力 | 56 页 | 835.78 KB | 2 年前3
兼容龙蜥的云原生大模型数据计算系统:πDataCS## 兼容龙蜥的云原生大模型数据计算系统 ## --πDataCS简介 ## 吴疆 拓数派产品市场总监  ## 吴疆 拓数派(Openpie)产品市场总监 深耕云计算和数据库行业十余年 毕业于清华大学计算机系,先后在IBM,EM 的算法和数学模型,建立下一代云原生数据平台的前沿标准,驱动企业实现从"软件公司"到"数据公司"再到"数学公司"的持续进阶。 拓数派旗下大模型数据计算系统(PieDataComputing System,缩写πDataCS),以云原生技术重构数据存储和计算,一份存储,多引擎数据计算,全面升级大数据系统至大模型时代,使得自主可控的大模型数据计算系统 保持全球领先,成为AI的基础科技底座的同时,开启AI技术的新范式。πDataCS旨在助力企业优化计算瓶颈、充分利用和发挥数据规模优势,构建核心技术壁垒,让大模型技术全面赋能行业AI场景应用,助力合作伙伴成功,为企业创造更大的商业价值。 ## 拓数派中国总部与全球分支机构  邱培峰 拓数派向量数据库负责人 目前在拓数派负责向量数据库PieCloudVector产品,聚焦于大模型与大数据 plum团队,担任外部数据源访问框架,对象存储访问扩展,ETL工具等产品模块的研发,并曾参与PostgreSQL多个版本的代码贡献,拥有丰富的存储模块核心开发和性能优化等实践经验。 ## 拓数派:大模型数据计算系统先行者 - 拓数派(OpenPie)是立足于国内的基础数据计算领域高科技创新机构; 拥有强大的数据库内核研发团队、数据科学团队和数字化转型团队; - 国内虚拟数仓和eMPP技术提出 e”)于2023年3月正式提出。 数仓虚拟化 $ ^{[1]} $ 可将物理数仓整合到云原生数据计算平台 $ ^{[2]} $ ,根据数据授权动态创建虚拟数仓,按需灵活计算,打破数据孤岛,支撑更大模型所需的数据和计算 $ ^{[3]} $ 。在云上,数据计算资源按需扩缩容,提升数仓的敏捷性和弹性,助力企业降低数仓管理复杂度 $ ^{[4]} $ ,实现数量级增加可计算数据空间的同时,数量级降低数0 码力 | 28 页 | 1.69 MB | 1 年前3
JVM 内存模型## JVM 内存模型 0 码力 | 1 页 | 48.42 KB | 2 年前3
阿里云容器服务大促备战## 全民双十一 基于容器服务的大促备战  李斌 阿里云容器服务  ## 我是谁 NAS, CPFS, OSS Public Cloud Edge Computing Private Cloud 云原生实时计算与人工智能@微博 2.4倍性能提升 百亿实时样本 万亿维度模型 ## 云原生基础设施 新生态 新算力 新基石 ## 阿里云容器服务 容器云应用市场 合作伙伴计划 极速弹性 分钟级1000节点伸缩 异构算力 利用率提升5倍 沙箱容器 强隔离,90%原生性能0 码力 | 17 页 | 17.74 MB | 1 年前3
陈宗志:大容量redis存储方案--Pika## 大容量redis存储方案--Pika 陈宗志 360基础架构组技术经理 ## 简介 ## • 13年入职360 基础架构组 – Bada – Pika – Zeppelin – Mario, Pink, slash, floyd • https://github.com/Qihoo360 ## 概要 - 存在问题 - 分析问题 - 解决问题 - Pika vs redis redis ## I ntroduction - Pika 是DBA 和 基础架构团队一起设计开发的大容量redis的解决方案 - 完全兼容redis 协议, 用户不需要修改任何代码进行迁移 ## Pika User • Redis实例数量:6000+个 • 日访问量:5000+亿 • Pika数据数量:1000+个 • 日访问量:1000+亿 • 覆盖率:80%以上业务线 • 单份数据体积:6 便捷运维设计的前提下通过持久化存储的方式解决 Redis 在大容量场景下的问题 ## Redis 问题 - 恢复时间长 - 一主多从, 主从切换代价大 - 缓冲区写满问题 - 成本问题 ## Redis 问题 ## • 恢复时间长 – 50G redis 回复时间70分钟 – 同时开启aof 和 rdb ## Redis 问题 ## • 一主多从, 主从切换代价大 ## – 主库挂掉后升级从库, 所有的从库全部重传数据0 码力 | 47 页 | 2.18 MB | 2 年前3
3 基于Azure的Python机器学习 王大伟/e/4/f/6/e4f61af16f650f1e38c1d341f3e7a639/p1_2.jpg) ## 基于Azure的Python机器学习 平安金融壹账通大数据研究院 微软MVP 王大伟 ## 目录 >> Azure与Python >> 如何用Azure完成机器学习 >> Azure与自动机器学习 >> 工程、模型选择、模型评估、模型应用。 而算法工程师的工作一般是从特征工程开始。 自动机器学习的自动体现在:自动特征工程、自动模型选择、自动超参数优化等。  ## 自动机器学习解决了什么问题? 如何有效选择对应于特定数据集的模型至关重要。 要。 自动模型选择 自动特征工程 自动超参数优化 手动特征工程效率低、可移植性差、受到创造力的限制。 大量超参数如何自动优化?  ## 利用Azure自动机器学习 Dataset Optimization Metric !0 码力 | 31 页 | 3.69 MB | 2 年前3
RustBelt - Rust 的形式化语义模型RUST CHINA CONF 2023 第三届中国 Rust 开发者大会 王俊吉 6.17-6.18 @Shanghai ## Outline ## RustBelt - Rust 的形式化语义模型 Background Rust Semantics • RustBelt Project • Type System • Rust Types Overview • The own Predict0 码力 | 21 页 | 2.63 MB | 2 年前3
领域驱动设计&中台/架构分层模型适配## 架构分层模型适配 有效防止架构腐化实践 吴雪峰@201811 DDCHINA ## CONTENTS 01 DDD分层参考架构 02 严纪律 防腐化 — 分层模型适配 03 分层模型适配实例 ## DDD分层参考架构 ## DDD分层参考架构 前端应用  给用户提供界面,关注用户交互和体验 为前端应用提供API服务,关注事务和分布式等技术性问题 领域模型和领域逻辑,关注业务概念。 访问外界系统(调用外界系统)的技术相关实现。 分层依据: 干系人和技术点 ## DDD分层参考架构 - 前端应用 前端应用 UX关注的层  ## 腐化案例: 亏空 大量技术术语业务人员完全看不懂领域模型和领域逻辑,关注业务概念。0 码力 | 39 页 | 2.54 MB | 2 年前3
共 1000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 100













