RNN训练难题
RNN训练难题 主讲人:龙良曲 Simple Yet? ▪ Nothing is straightforward. Gradient Exploding and Gradient Vanishing Why https://weberna.github.io/blog/2017/11/15/LSTM-Vanishing-Gradients.html Step 1. Gradient Exploding0 码力 | 12 页 | 967.80 KB | 1 年前32 使用Python训练和部署低精度模型 张校捷
使用Python训练和部署低精度模型 (TensorFlow版) 张校捷 2019/9/21 目录 CONTENTS 低精度的概念和意义 TensorFlow的FP16模型 TensorRT的FP16/Int8模型 总结 1 低精度的概念和意义 实数的16-bit半精度浮点数和8-bit定点数表示 使用低精度的意义 深度学习模型中实数的表示 FP32: E8M23 FP16: 6X speedup ResNet-50-v1.5 3.3X speedup SSD-RN50-FPN-640 2.5X speedup FP16浮点数(E5M10)的表示范围 FP16模型的训练方法 Int8模型的推断过程 2 TensorFlow的FP16模型 实数的16-bit半精度浮点数和8-bit定点数表示 使用低精度的意义 TensorCores适用条件 1. 卷积:K(输入通道),C(输出通道) com/tensorflow/tensorflow/blob/master/tensorflow/core/grappler/ optimizers/auto_mixed_precision_lists.h FP16训练模型精度 https://arxiv.org/pdf/1710.03740.pdf 3 TensorRT的FP16/Int8模型 TensorFlow中使用TensorRT 在TensorRT中使用FP16/Int80 码力 | 24 页 | 981.45 KB | 1 年前3Rust OS 开源操作系统训练营的教与学-0615-李明
开源操作系统训练营的教与学 李明 清华大学 2023-6-17 Rust China Conf 2023 Rust OS 开源操作系统训练营的教与学 1 Rust OS 开源训练营的起因和发展 Title Title Title 开源操作系统训练营的起源(2020年) 陈渝老师 向勇老师 OS Tutorial Summer of Code 2020 训练营过去三年的发展情况 训练营过去三年的发展情况 2020年 ~ 2022年 • 2020年 • 夏季训练营 2020.7.1 ~ 8.31 • 2021年 • 夏季训练营 2021.7.1 ~ 7.31 • 2022年 • 夏季训练营 2022.7.3 ~ 8.31 • 秋冬季训练营 2022.10.16 ~ 2023.2.1 50 118 188 448 0 50 100 150 200 250 300 1000+ 训练营的愿景和目标 目标 愿景 核心产出 探索新一代安全高性能操作系统的设计与构建 影响并培养更多的人学会写操作系统 每年为高校和企业培养1000名操作系统开发人才 参加训练营要回答的三个问题 你为什么要来参加这个活动? 为什么要以开源 的方式来参与? 我们如何能把这些 知识技能学到? Rust OS 开源操作系统训练营的教与学 2 开源训练营的总体规划和教学实践0 码力 | 26 页 | 2.62 MB | 1 年前3运维上海2017-机器学习模型训练的Kubernetes实践-袁晓沛
0 码力 | 39 页 | 5.82 MB | 1 年前3《TensorFlow 2项目进阶实战》2-快速上手篇:动⼿训练模型和部署服务
项目进阶实战》视频课程 快速上手篇:动⼿训练模型和部署服务 • TensorFlow 2 开发环境搭建 • 使用 tf.keras.datasets 加载数据 • 使用 tf.data.Dataset 加载数据 • 使用 tf.keras.Model 管理模型 • Fashion MNIST 数据集介绍 • 使用 TensorFlow 2 训练分类网络 目录 TensorFlow 2 Model • Class tf.keras.models.Model 使用 tf.keras.Model 构建模型 使用 tf.keras.Model 构建模型 使用 tf.keras.Model 训练模型 保存和加载 h5 模型 保存和加载 SavedModel 模型 Fashion MNIST 数据集介绍 Original MNIST dataset The MNIST database original MNIST Benchmark on Fashion MNIST Benchmark Side-by-side Fashion MNIST dataset 使用 TensorFlow 2 训练分类网络 Get Fashion MNIST dataset from tensorflow I mport keras import tensorflow as tf fashion_mnist0 码力 | 52 页 | 7.99 MB | 1 年前3【PyTorch深度学习-龙龙老师】-测试版202112
7.8 Himmelblau 函数优化实战 7.9 反向传播算法实战 7.10 参考文献 第 8 章 PyTorch 高级用法 8.1 常见功能模块 8.2 模型装配、训练与测试 8.3 模型保存与加载 8.4 自定义类 8.5 模型乐园 8.6 测量工具 8.7 可视化 8.8 参考文献 第 9 章 过拟合 9.1 模型的容量 11.7 RNN 短时记忆 11.8 LSTM 原理 11.9 LSTM 层使用方法 11.10 GRU 简介 11.11 LSTM/GRU 情感分类问题再战 11.12 预训练的词向量 11.13 参考文献 第 12 章 自编码器 12.1 自编码器原理 12.2 MNIST 图片重建实战 12.3 自编码器变种 12.4 变分自编码器 12 生成对抗网络 13.1 博弈学习实例 13.2 GAN 原理 13.3 DCGAN 实战 13.4 GAN 变种 预览版202112 13.5 纳什均衡 13.6 GAN 训练难题 13.7 WGAN 原理 13.8 WGAN-GP 实战 13.9 参考文献 第 14 章 强化学习 14.1 先睹为快 14.2 强化学习问题 14.3 策略梯度方法0 码力 | 439 页 | 29.91 MB | 1 年前3动手学深度学习 v2.0
3.2.6 定义优化算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 3.2.7 训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 3.3 线性回归的简洁实现 3.3.6 定义优化算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 3.3.7 训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 3.4 softmax回归 5 分类精度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 3.6.6 训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 3.6.7 预测0 码力 | 797 页 | 29.45 MB | 1 年前3PaddleDTX 1.1.0 中文文档
docker 安装 客户端工具 操作XuperDB 操作Distributed AI 案例应用-线性回归算法测试 案例简介 测试脚本说明 上传样本文件 训练任务 预测任务 模型评估 案例应用-逻辑回归算法测试 案例简介 测试脚本说明 上传样本文件 训练任务 预测任务 模型评估 系统详解 部署架构 计算需求方(Requester) 任务执行节点(Executor Node) 数据持有节点(DataOwner 保证多方数据联合建模的全链路可信 架构概览 PaddleDTX由多方安全计算网络、去中心化存储网络、区块链网络构建而成。 1.1 多方安全计算网络 有预测需求的一方为计算需求节点。可获取样本数据进行模型训练和预测的一 方为任务执行节点,多个任务执行节点组成一个SMPC(多方安全计算)网 络。计算需求节点将任务发布到区块链网络,任务执行节点确认后执行任务。 数据持有节点对任务执行节点的计算数据做信任背书。 分片。通过这些 机制,实现了在不泄漏隐私的前提下充分且安全地利用存储资源。 训练样本和预测数据集往往是归属于不同机构的隐私数据。这些机构可以作为 数据持有节点加入到去中心化存储网络中,通过多方安全计算网络发挥数据的 最大价值。 1.3 区块链网络 训练任务和预测任务通过区块链网络广播到任务执行节点,后者继而执行训练 任务和预测任务。数据持有节点和存储节点在副本保持证明、健康状态监控过 程中,通过区块链网络实现信息交换。0 码力 | 57 页 | 1.38 MB | 1 年前3PaddleDTX 1.1.0 中文文档
由多方安全计算网络、去中心化存储网络、区块链网络构建而成。 1 PaddleDTX Documentation 1.2.1 1.1 多方安全计算网络 有预测需求的一方为计算需求节点。可获取样本数据进行模型训练和预测的一方为任务执行节点,多个任务 执行节点组成一个 SMPC(多方安全计算)网络。计算需求节点将任务发布到区块链网络,任务执行节点确 认后执行任务。数据持有节点对任务执行节点的计算数据做信任背书。 节点的挑战证明自己持有数据分片。通过这些机制,实现了在不泄漏隐私的前提下充分且安全地利用存储资 源。 训练样本和预测数据集往往是归属于不同机构的隐私数据。这些机构可以作为数据持有节点加入到去中心化 存储网络中,通过多方安全计算网络发挥数据的最大价值。 1.2.3 1.3 区块链网络 训练任务和预测任务通过区块链网络广播到任务执行节点,后者继而执行训练任务和预测任务。数据持有节 点和存储节点在副本保持证明、健康状态监控过程中,通过区块链网络实现信息交换。 的相关概念,帮助您初步认识系统,了解其基本运行机制,方便后续进一步阅读。 2.1 节点和网络 PaddleDTX 中有五类节点: • 计算需求节点(Requester)有训练模型和预测需求。 • 任务执行节点(Executor)拥有使用数据的权限,参与多方安全计算,进行模型训练和数据预测。 • 数据持有节点(DataOwner)是数据的归属方,有存储数据的需求。 • 存储节点(Storage Nodes)有丰富的闲置的存储资源,可以提供存储服务。0 码力 | 65 页 | 687.09 KB | 1 年前32020美团技术年货 算法篇
搜索引 擎。当前,美团搜索整体架构主要由搜索数据平台、在线检索框架及云搜平台、在线 AI 服务及实验平台三大体系构成。在 AI 服务及实验平台中,模型训练平台 Poker 和 在线预估框架 Augur 是搜索 AI 化的核心组件,解决了模型从离线训练到在线服务的 一系列系统问题,极大地提升了整个搜索策略迭代效率、在线模型预估的性能以及排 序稳定性,并助力商户、外卖、内容等核心搜索场景业务指标的飞速提升。 入模型,并根据输出的 值(即模型预估的值)对原有的文档进行排序或者其他处理。 纯粹从一个工程人员视角来看: 模型可以简化为一个公式( 举例:f(x1,x2)= ax1 + bx2 +c ),训练模型是找出最合适的参数 abc。所谓特征,是其中的自变量 x1 与 x2,而模型预估,就是将给定的自变量 x1 与 x2 代入公式,求得一个解而已。(当然 实际模型输出的结果可能会更加复杂,包括输出矩阵、向量等等,这里只是简单的举 离线能力缺失? Poker 是搜索实验平台的名字。我们设计它的初衷,是解决搜索模型实验中,从离 线到在线所有繁复的手工操作,使搜索拥有一键训练、一键 Fork、一键上线的能力。 与公司其他的训练平台不同,我们通过完善的在线预估框架倒推离线训练的需求,进 而构建了与在线无缝结合的搜索实验平台,极大地提升了算法同学的工作效。 未来,我们也会向大家介绍产品级别的一站式搜索实验平台,敬请期待。0 码力 | 317 页 | 16.57 MB | 1 年前3
共 229 条
- 1
- 2
- 3
- 4
- 5
- 6
- 23