LLM推理与服务 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

夏歌-使用Rust构建LLM应用

## RUST CHINA CONF 2023 第三届中国 Rust 开发者大会 6.17-6.18 @Shanghai ## 使用 Rust 构建 LLM 应用夏歌 ## 😍 ![Image](/uploads/documents/b/4/b/2/b4b20fa17af007f415a446d15b2b9803/p3_1.jpg) ## Bojan Tunguz ![Image Pytorch、TensorFlow Lite 推理 WASI-NN 2.0 AI 应用相关的工具比如 Langchain # Rewrite it in Rust 为什么要用 Rust？ ![Image](/uploads/documents/b/4/b/2/b4b20fa17af007f415a446d15b2b9803/p6_1.jpg) Python 与 Docker • 笨重 • 资源占用多 Rust 与 WebAssembly - 轻量级 - 资源占用量小 - 节省大量计算资源 # Rewrite it in Rust 为什么不用 Rust？ Rust 太难学！学习曲线太陡峭了，学习周期太长了招 Rust 开发太难了 ## Rust 在系统编程已经取得了巨大成功 ## Low code Rust ## 培养更广泛的 Rust 开发围绕 LLM 生态封装相应的

0 码力 | 36 页 | 38.31 MB | 2 年前
3
开源中国 2023 大模型(LLM)技术报告

## COSCHINA gitee ## 2023 中国开源开发者报告 China Open Source 2023 Annual Report ## LLM 技术报告出品：OSCHINA & Gitee 编委会：雨多田光，OSCHINA总编局长，OSCHINA主编王茜，OSCHINA主编叶子，OSCHINA新媒体运营鱼仔，OSCHINA新媒体运营诺墨，Gitee开源社区产品负责人设计：张琪 ## LLM 技术报告大语言模型（LLM）技术作为人工智能领域的一项重要创新在今年引起了广泛的关注。 LLM 是利用深度学习和大数据训练的人工智能系统，专门设计来理解、生成和回应自然语言。这些模型通过分析大量的文本数据来学习语言的结构和用法，从而能够执行各种语言相关任务。以 GPT 系列为代表，LLM 以其在自然语言处理领域的卓越表现，成为推动语言理解、生成和应用的引擎。 LLM 在多个在多个领域都取得了令人瞩目的成就。在自然语言处理领域，GPT 系列模型在文本生成、问答系统和对话生成等任务中展现出色的性能。在知识图谱构建、智能助手开发等方面，LLM 技术也发挥了关键作用。此外，它还在代码生成、文本摘要、翻译等任务中展现了强大的通用性。本报告从技术人视角出发，将深入探讨 LLM 技术的背景、基础设施、应用现状，以及相关的工具和平台。 ![Image](/uploads/documents/f/4/8/5

0 码力 | 32 页 | 13.09 MB | 2 年前
3
vLLM v0.5.0 Documentation

Documentation 3 2 Indices and tables 123 Python Module Index 125 Index 127 ## LLM vLLM is a fast and easy-to-use library for LLM inference and serving. vLLM is fast with: - State-of-the-art serving throughput to PagedAttention) - vLLM paper (SOSP 2023) - How continuous batching enables 23x throughput in LLM inference while reducing p50 latency by Cade Daniel et al. - vLLM Meetups. ## DOCUMENTATION ## 1 other words, we use vLLM to generate texts for a list of input prompts. Import LLM and SamplingParams from vLLM. The LLM class is the main class for running offline inference with vLLM engine. The SamplingParams

0 码力 | 132 页 | 1.05 MB | 5 月前
3
使用Spring Cloud与Docker实战微服务

目录致谢介绍 1 微服务简介 2 Spring Cloud 2.1 服务发现 2.1.1 Eureka 2.1.2 Eureka的高可用 2.1.3 Consul 2.1.4 Consul安装与使用 2.1.5 Consul常用命令 2.1.6 Consul高可用 2.2 服务提供者 2.3 服务消费者 2.3.1 Ribbon 2.3.2. Feign 2.4 熔断器 2.4.1. Hystrix Dashboard 2.4.3. Turbine 2.5 配置中心 2.6 API Gateway 3 使用Docker构建微服务 3.1 Docker介绍 3.2 Docker的安装 3.3 Docker的常用命令 3.4 Dockerfile常用指令 3.5 Docker私有仓库的搭建与使用 3.6 使用Dockerfile构建Docker镜像 3.7 使用Maven插件构建Docker镜像 3.8 Docker docker-compose.yml常用命令 8.4 docker-compose常用命令 8.5 使用Docker Compose部署项目致谢当前文档《使用Spring Cloud与Docker实战微服务》由进击的皇虫使用书栈（BookStack.CN）进行构建，生成于 2018- 05-03。书栈（BookStack.CN）仅提供文档编写、整理、归类等功能，以及对文档内容的生成和导出工具。

0 码力 | 179 页 | 2.57 MB | 3 月前
3
微服务架构与领域驱动设计 - 王磊

## 微服务架构与领域驱动设计王磊 ## 关于我 ![Image](/uploads/documents/4/0/7/5/40750bf1f86244e6930c200f69cabe6f/p2_1.jpg) ![Image](/uploads/documents/4/0/7/5/40750bf1f86244e6930c200f69cabe6f/p2_2.jpg) ## 华为 - 2012技术专家 Leader • 丰富的持续交付/微服务架构/DevOPS经验 • 《微服务架构与实践》作者 • 《DevOps实践指南》译者 • 中国首批EXIN DevOps Master教练 • 西安DevOps Meetup 联合发起人 • 《消费者驱动契约测试-Pact》译者 • 《使用SpringBoot/Cloud构建微服务》视频作者(StuQ) 01 微服务架构与DDD 02 领域驱动设计的核心领域驱动设计的核心 03 基于事件风暴的DDD实践 ## 什么是微服务架构 ![Image](/uploads/documents/4/0/7/5/40750bf1f86244e6930c200f69cabe6f/p4_1.jpg) ## 微服务架构 ![Image](/uploads/documents/4/0/7/5/40750bf1f86244e6930c200f69cabe6f/p5_1

0 码力 | 28 页 | 1.84 MB | 2 年前
3
微服务环境下的系统治理与容错

## 微服务环境下的系统治理与容错王新栋 ![Image](/uploads/documents/4/2/6/7/4267818b8713b60c5bdacc2478dc125e/p2_1.jpg) ## 收获国内外一线大厂实践与技术大咖同行成长 ✓ 演讲视频 ✓ 干货整理 ✓ 大咖采访 ✓ 行业趋势关注 QCon 公众号 ![Image](/uploads/documents/ 60c5bdacc2478dc125e/p2_2.jpg) ## About The SPEAKER - 《架构修炼之道》作者，《决战618：探秘京东技术取胜之道》联合作者； - 对分布式、微服务系统有多年实战经验，所设计和研发的系统经历了多次百亿流量的验证； - 热爱分享，维护技术公众号 [程序渠道]，对高并发、高可用系统有持续不懈的追求；个人微信号 ![Image](/uploa jpg) ## TABLE OF CONTENTS 大纲 - 微服务架构 • 治理 • 容错 • 总结 ![Image](/uploads/documents/4/2/6/7/4267818b8713b60c5bdacc2478dc125e/p4_1.jpg) ## 微服务架构 ## 架构 ## 架构是为应用程序服务的 ## 软件系统应用程序的需求 ## 功能性需求 ☑ C端用户需要能够快速查看自己的订单

0 码力 | 45 页 | 16.09 MB | 2 年前
3
微服务的设计原则与⽣态系统 - 王磊

## 微服务的设计原则与生态系统王磊 ## 关于我 ![Image](/uploads/documents/b/2/2/d/b22d07eaea0b5b3936e4c395f448894f/p2_2.jpg) Ruby Gems 开发实战 ![Image](/uploads/documents/b/2/2/d/b22d07eaea0b5b3936e4c395f448894f/p2_3 ThoughtWorks首席咨询师 Sybase Tech Leader 《微服务架构与实践》作者 • 《DevOps Handbook》中文译者之一 • 国内较早倡导和实践微服务的先行者 - 对于自动化测试、持续交付、DevOps有丰富的实践经验西安DevOps Meetup 联合发起人 ## 议题 • 微服务架构的核心 • 微服务架构设计原则 • 微服务架构生态系统 ## Are you using microservices 什么是微服务架构？ ![Image](/uploads/documents/b/2/2/d/b22d07eaea0b5b3936e4c395f448894f/p7_2.jpg) ## Microservices – the new architectural style Martin Fowler, Mar 2014 - 微服务架构是一种架构模式，将单体应用划分成一组小的服务，服务之间互相协作，为用户提供最终价值

0 码力 | 62 页 | 6.65 MB | 2 年前
3
vLLM v0.4.2 Documentation

Documentation 3 2 Indices and tables 91 Python Module Index 93 Index 95 ## LLM vLLM is a fast and easy-to-use library for LLM inference and serving. vLLM is fast with: - State-of-the-art serving throughput to PagedAttention) - vLLM paper (SOSP 2023) - How continuous batching enables 23x throughput in LLM inference while reducing p50 latency by Cade Daniel et al. ## DOCUMENTATION ## 1.1 Installation vLLM other words, we use vLLM to generate texts for a list of input prompts. Import LLM and SamplingParams from vLLM. The LLM class is the main class for running offline inference with vLLM engine. The SamplingParams

0 码力 | 99 页 | 982.83 KB | 5 月前
3
vLLM v0.5.0.post1 Documentation

Documentation 3 2 Indices and tables 135 Python Module Index 137 Index 139 ## LLM vLLM is a fast and easy-to-use library for LLM inference and serving. vLLM is fast with: - State-of-the-art serving throughput to PagedAttention) - vLLM paper (SOSP 2023) - How continuous batching enables 23x throughput in LLM inference while reducing p50 latency by Cade Daniel et al. - vLLM Meetups. ## DOCUMENTATION ## 1 other words, we use vLLM to generate texts for a list of input prompts. Import LLM and SamplingParams from vLLM. The LLM class is the main class for running offline inference with vLLM engine. The SamplingParams

0 码力 | 144 页 | 1.09 MB | 5 月前
3
添加测试服务

0 码力 | 1 页 | 128.00 B | 1 年前
3

共 1000 条前往

页

分类

语言

格式

夏歌-使用Rust构建LLM应用

开源中国 2023 大模型(LLM)技术报告

vLLM v0.5.0 Documentation

使用Spring Cloud与Docker实战微服务

微服务架构与领域驱动设计 - 王磊

微服务环境下的系统治理与容错

微服务的设计原则与⽣态系统 - 王磊

vLLM v0.4.2 Documentation

vLLM v0.5.0.post1 Documentation

添加测试服务

搜索

分类

语言

格式