时空推理 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

星际争霸与人工智能

0 码力 | 24 页 | 2.54 MB | 2 年前
3
DeepSeek从入门到精通(20250204)

DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。 ![Image](/uploads/ 32d/p3_1.jpg) AI + 国产 + 免费 + 开源 + 强大 ## Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。 ![Image](/uploads/documents/f/3/7/0/f3706 垃圾内容检测 ![Image](/uploads/documents/f/3/7/0/f37064274bc52e8d62ab0d2bc829c32d/p6_1.jpg) ## 知识推理知识推理逻辑问题解答（数学、常识推理）因果分析（事件关联性） ## 编程与代码相关 ![Image](/uploads/documents/f/3/7/0/f37064274bc52e8d62ab0d2bc829c32d/p7_1

0 码力 | 104 页 | 5.37 MB | 1 年前
3
从推荐模型的基础特点看大规模推荐类深度学习系统的设计袁镱

.jpg) ## ☐ 袁镱博士，专家工程师 ☐ 研究方向：机器学习系统，云计算，大数据系统 ☐ 负责腾讯平台与内容事业群（PCG）技术中台核心引擎：无量系统。支持大规模稀疏模型训练，上线与推理 ## ☐ 无量系统 ☐ 项目于17年启动，先后经过了6个主要版本的迭代 ☐ 覆盖腾讯PCG全部业务的推荐场景，支持腾讯IEG，CSIG，QQ音乐，阅文等业务的部分推荐场景 ## 提纲 ☐ 推荐场景深度学习系统的基本问题与特点，QQ看点，浏览器，微视，QQ小世界等） ☐ 腾讯系内容推荐：阅文集团，QQ音乐 ☐ Facebook推荐场景推理成本占AI推理成本的>72% [ISCA2020 RecNMP] ## ☐ 千亿级推荐模型应用 01. 千亿级特征（TB级）的模型的在线/离线训练，在线推理服务和持续上线 O2. 针对推荐特点的深度优化，达到业界先进水平短期命中的高频key随时间缓慢变化 ## 推荐系统的核心特点 ![Image](/uploads/documents/7/4/3/d/743d3e9d4f868ca103d724198ede00ef/p6_1.jpg) ## ☐ Feature 2（数据的时空特点） 2.1 短时间内只有部分item和user被命中，只有部分参数被用到 ☐ Feature 1（基本特点） 1.1 User与推荐系统交互，7*24小时流式学习 1.2 Item和Us

0 码力 | 22 页 | 6.76 MB | 2 年前
3
2022年美团技术年货合辑

YOLOv6 是美团视觉智能部研发的一款目标检测框架，致力于工业应用。本框架同时专注于检测的精度和推理效率，在工业界常用的尺寸模型中：YOLOv6-nano 在 COCO 上精度可达 35.0% AP，在 T4 上推理速度可达 1242 FPS；YOLOv6-s 在 COCO 上精度可达 43.1% AP，在 T4 上推理速度可达 520 FPS。在部署方面，YOLOv6 支持 GPU（TensorRT）、C $ 最具代表性，但在实际使用中，我们发现上述框架在速度和精度方面仍有很大的提升的空间。基于此，我们通过研究并借鉴了业界已有的先进技术，开发了一套新的目标检测框架——YOLOv6。该框架支持模型训练、推理及多平台部署等全链条的工业应用需求，并在网络结构、训练策略等算法层面进行了多项改进和优化，在 COCO 数据集上，YOLOv6 在精度和速度方面均超越其他同体量算法，相关结果如下图 1 所示： ![ p10_1.jpg) 图 2 Roofline Model 介绍图于是，我们基于硬件感知神经网络设计的思想，对 Backbone 和 Neck 进行了重新设计和优化。该思想基于硬件的特性、推理框架 / 编译框架的特点，以硬件和编译友好的结构作为设计原则，在网络构建时，综合考虑硬件计算能力、内存带宽、编译优化特性、网络表征能力等，进而获得又快又好的网络结构。对上述重新设计的两个检测部件，我们在

0 码力 | 1356 页 | 45.90 MB | 2 年前
3
vLLM v0.4.2 Documentation

0 码力 | 99 页 | 982.83 KB | 5 月前
3
vLLM v0.5.0.post1 Documentation

0 码力 | 144 页 | 1.09 MB | 5 月前
3
清华大学第二弹：DeepSeek赋能职场

清华大学 @新媒沈阳团队向安玲 ## 人机协同与共生驾驭AI实现新式智能 Sam Altman: AI发展的五个级别 Reasoner Agent Organization - 基本的推理和问题解决能力 Chatbot ·代表用户执行任务，具备自主行动能力 Innovator - 参与发明和创造，增强人类的创造力和创新能力 - 承担整个组织的功能，独立管理并执行复杂的操作 2.jpg) ## DeepSeek 三种模式对比 • 基础模型（V3）：通用模型（2024.12），高效便捷，适用于绝大多数任务，“规范性”任务 • 深度思考（R1）：推理模型，复杂推理和深度分析任务，如数理逻辑推理和编程代码，“开放性”任务 • 联网搜索：RAG（检索增强生成），知识库更新至2024年7月 V3 还是 R1？过程驱动（规范约束）还是结果驱动（模糊目标）？ ## DeepSeek 内容：HTTP协议基础、反爬机制与应对策略、数据清洗预处理 ## 如何提问？两种模型的提示语差异 • 基础模型（V3）：“过程-结果”清晰（指令） • 深度思考（R1）：目标清晰，结果可以模糊（推理） ## RTGO提示语结构 ## Role（角色）定义AI的角色：经验丰富的数据分析师具备十年销售经验的SaaS系统商务 ## RTGO ## Task（任务）具体任务描述：

0 码力 | 35 页 | 9.78 MB | 1 年前
3
清华大学 DeepSeek 从入门到精通

DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。 ![Image](/uploads/ 2de/p3_1.jpg) AI + 国产 + 免费 + 开源 + 强大 ## Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。 ![Image](/uploads/documents/5/1/3/f/513f8 垃圾内容检测 ![Image](/uploads/documents/5/1/3/f/513f8baf8f2fc5547b0250d9608bf2de/p6_1.jpg) ## 知识推理知识推理逻辑问题解答（数学、常识推理）因果分析（事件关联性） ## 编程与代码相关 ![Image](/uploads/documents/5/1/3/f/513f8baf8f2fc5547b0250d9608bf2de/p7_1

0 码力 | 103 页 | 5.40 MB | 1 年前
3
Keras: 基于 Python 的深度学习库

的结果只会用来更新一次模型。- 一个 batch 的样本通常比单个输入更接近于总体输入数据的分布，batch 越大就越近似。然而，每个 batch 将花费更长的时间来处理，并且仍然只更新模型一次。在推理（评估/预测）时，建议条件允许的情况下选择一个尽可能大的 batch，（因为较大的 batch 通常评估/预测的速度会更快）。 • Epoch: 轮次，通常被定义为「在整个数据集上的一轮迭代」，用 } = [\text{a}, \text{b}], \text{output} = \text{c}) $ 添加的 Keras 属性是：- keras_shape: 通过 Keras 端的尺寸推理进行传播的整数尺寸元组。- keras_history: 应用于张量的最后一层。整个网络层计算图可以递归地从该层中检索。 ## 参数 - shape: 一个尺寸元组（整数），不包含批量大小。A shape 任意。当使用此层作为模型中的第一层时，使用参数 input_shape（整数元组，不包括样本数的轴）。 ## 输出尺寸由 output_shape 参数指定 (或者在使用 TensorFlow 时，自动推理得到)。 #### 5.2.10 ActivityRegularization [source] keras.layers.ActivityRegularization(l1=0.0, l2=0

0 码力 | 257 页 | 1.19 MB | 2 年前
3
vLLM v0.5.0 Documentation

0 码力 | 132 页 | 1.05 MB | 5 月前
3

共 203 条前往

页

分类

语言

格式

星际争霸与人工智能

DeepSeek从入门到精通(20250204)

从推荐模型的基础特点看大规模推荐类深度学习系统的设计袁镱

2022年美团技术年货合辑

vLLM v0.4.2 Documentation

vLLM v0.5.0.post1 Documentation

清华大学第二弹：DeepSeek赋能职场

清华大学 DeepSeek 从入门到精通

Keras: 基于 Python 的深度学习库

vLLM v0.5.0 Documentation

搜索

分类

语言

格式