梯度消失 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

深度学习与PyTorch入门实战 - 50. RNN训练难题

0 码力 | 12 页 | 967.80 KB | 2 年前
3
深度学习与PyTorch入门实战 - 18.2 LOSS及其梯度

## PyTorch ## LOSS及其梯度主讲人：龙良曲 ## Typical Loss ## Mean Squared Error ## Cross Entropy Loss binary multi-class +softmax Leave it to Logistic Regression Part ## MSE $$ \begin{aligned} ■ loss=\

0 码力 | 14 页 | 989.18 KB | 2 年前
3
深度学习与PyTorch入门实战 - 18.1 激活函数梯度

## PyTorch ## 激活函数及其梯度主讲人：龙良曲 ## Activation Functions ![Image](/uploads/documents/2/9/5/8/295886b03573aa9e0c26df2654022bc7/p2_1.jpg) PITTS WITH LETTVIN: Pitts with Jerome Lettvin and one subject tensor([0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.1111, 0.3333, 0.5556, 0.7778, 1.0000]) ## 下一课时 Loss及其梯度 ## Thank You

0 码力 | 14 页 | 724.00 KB | 2 年前
3
常见函数梯度

## PyTorch ## 常见函数梯度主讲人：龙良曲 ## Common Functions |Common Functions|Function|Derivative| |---|---|---| |Constant|c|0| |Line|x|1| ||ax|a| |Square|$ x^{2} $|2x| |Square Root|$ \\sqrt{x} $|$ (\\frac{1

0 码力 | 9 页 | 282.15 KB | 2 年前
3
什么是梯度

## PyTorch ## 什么是梯度主讲人：龙良曲 ## Clarification 导数, derive - 偏微分, partial derive 梯度, gradient $$ \nabla f=\left(\frac{\partial f}{\partial x_{1}};\frac{\partial f}{\partial x_{2}};\ldots;\frac{\partial jpg) ![Image](/uploads/documents/4/4/c/a/44ca8475cf66c2e795358aedc2286ff8/p15_6.jpg) ## 下一课时常见函数梯度 ## Thank You

0 码力 | 17 页 | 1.49 MB | 2 年前
3
动手学深度学习 v2.0

4.2 偏导数 ..... 68 2.4.3 梯度 ..... 68 2.4.4 链式法则 ..... 68 2.5 自动微分 ..... 69 2.5.1 一个简单的例子 ..... 70 2.5.2 非标量变量的反向传播 ..... 71 2.5.3 分离计算 ..... 71 2.5.4 Python控制流的梯度计算 ..... 72 2.6 概率 ..... 前向传播计算图 ..... 163 4.7.3 反向传播 ..... 164 4.7.4 训练神经网络 ..... 165 4.8 数值稳定性和模型初始化 ..... 166 4.8.1 梯度消失和梯度爆炸 ..... 166 4.8.2 参数初始化 ..... 168 4.9 环境和分布偏移 ..... 170 4.9.1 分布偏移的类型 ..... 171 4.9.2 分布偏移示例 4 预测 ..... 320 8.5.5 梯度裁剪 ..... 321 8.5.6 训练 ..... 322 8.6 循环神经网络的简洁实现 ..... 325 8.6.1 定义模型 ..... 326 8.6.2 训练与预测 ..... 328 8.7 通过时间反向传播 ..... 329 8.7.1 循环神经网络的梯度分析 ..... 330 8.7.2 通过时间反向传播的细节

0 码力 | 797 页 | 29.45 MB | 2 年前
3
机器学习课程-温州大学-06深度学习-优化算法

本章目录 01 小批量梯度下降 02 优化算法 03 超参数调整和BatchNorm 04 Softmax ### 1. 小批量梯度下降 ## 01 小批量梯度下降 02 优化算法 03 超参数调整和BatchNorm 04 Softmax ## 小批量梯度下降 ## 小批量梯度下降（Mini-Batch Gradient Descent）梯度下降的每一步中，用到了一定批量的训练样本 w_{j},\ (j=0,1,\ldots,n\text{)})\\\end{aligned} $$ b=1 （随机梯度下降,SGD） b=m （批量梯度下降,BGD） b=batch_size，通常是2的指数倍，常见有32,64,128等。 (小批量梯度下降,MBGD) ## 小批量梯度下降 Batch gradient descent ![Image](/uploads/documents ![Image](/uploads/documents/b/5/6/7/b567ec9747c87c33d45000790224cffe/p5_2.jpg) ### 2. 优化算法 01 小批量梯度下降 ## 02 优化算法 03 超参数调整和BatchNorm 04 Softmax ## 伦敦温度的例子 $$ \theta_{1}=40^{\circ}\mathrm{F} $$

0 码力 | 31 页 | 2.03 MB | 2 年前
3
机器学习课程-温州大学-13机器学习-人工神经网络

在趋向无穷的地方，函数值变化很小，容易出现梯度消失，不利于深层神经的反馈传输 2.幂函数的梯度计算复杂 3. 收敛速度比较慢 ### 3. BP算法 ## 主要步骤第一步，对样本明确预测输出值与损失函数第二步，明确参数调整策略第三步，计算输出层阈值的梯度第四步，计算隐层到输出层连接权值的梯度第五步，计算隐层阈值的梯度第六步，计算输入层到隐层连接权值的梯度第七步，引出归纳结论 ### iota}\left(\hat{y}_{j}^{k}-y_{j}^{k}\right)^{2} $$ ### 3. BP算法 ## 第二步，明确参数调整策略基于梯度下降（Gradient Descent）策略，以目标的负梯度方向对参数进行调整 $$ v=v+\Delta v $$ $$ \Delta v=-\rho\frac{\partial E_{n}}{\partial v} s/b/b/8/3/bb832788f20936427a2d2c5058e6831d/p19_1.jpg) ### 3. BP算法 ## 第三步，计算输出层阈值 $ \theta_{j} $ 的梯度 $ \frac{\partial E_{k}}{\partial \theta_{j}} $ 利用链式法则，可得 $$ \frac{\partial E_{k}}{\partial\the

0 码力 | 29 页 | 1.60 MB | 2 年前
3
深度学习与PyTorch入门实战 - 19.1 单一输出感知机

tensor([[−0.0107, −0.0021, 0.0047, 0.0092, −0.0091, −0.0030, 0.0069, −0.0105, −0.0061, −0.0051]]) ## 下一课时 MLP及梯度 ## Thank You

0 码力 | 8 页 | 548.71 KB | 2 年前
3
深度学习与PyTorch入门实战 - 03. 简单回归案例

## PyTorch ## 你好，梯度主讲人：龙良曲 ## Gradient Descent $$ \begin{aligned}&\bullet loss=x^{2}*\sin(x)\end{aligned} $$ ![Image](/uploads/documents/c/3/3/a/c33adffc28dcc1b669a93286a19f3fe7/p2_1.jpg)

0 码力 | 12 页 | 748.45 KB | 2 年前
3

共 415 条前往

页

分类

语言

格式

深度学习与PyTorch入门实战 - 50. RNN训练难题

深度学习与PyTorch入门实战 - 18.2 LOSS及其梯度

深度学习与PyTorch入门实战 - 18.1 激活函数梯度

常见函数梯度

什么是梯度

动手学深度学习 v2.0

机器学习课程-温州大学-06深度学习-优化算法

机器学习课程-温州大学-13机器学习-人工神经网络

深度学习与PyTorch入门实战 - 19.1 单一输出感知机

深度学习与PyTorch入门实战 - 03. 简单回归案例

搜索

分类

语言

格式