梯度爆炸 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

深度学习与PyTorch入门实战 - 50. RNN训练难题

0 码力 | 12 页 | 967.80 KB | 2 年前
3
深度学习与PyTorch入门实战 - 18.2 LOSS及其梯度

## PyTorch ## LOSS及其梯度主讲人：龙良曲 ## Typical Loss ## Mean Squared Error ## Cross Entropy Loss binary multi-class +softmax Leave it to Logistic Regression Part ## MSE $$ \begin{aligned} ■ loss=\

0 码力 | 14 页 | 989.18 KB | 2 年前
3
深度学习与PyTorch入门实战 - 18.1 激活函数梯度

## PyTorch ## 激活函数及其梯度主讲人：龙良曲 ## Activation Functions ![Image](/uploads/documents/2/9/5/8/295886b03573aa9e0c26df2654022bc7/p2_1.jpg) PITTS WITH LETTVIN: Pitts with Jerome Lettvin and one subject tensor([0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.1111, 0.3333, 0.5556, 0.7778, 1.0000]) ## 下一课时 Loss及其梯度 ## Thank You

0 码力 | 14 页 | 724.00 KB | 2 年前
3
常见函数梯度

## PyTorch ## 常见函数梯度主讲人：龙良曲 ## Common Functions |Common Functions|Function|Derivative| |---|---|---| |Constant|c|0| |Line|x|1| ||ax|a| |Square|$ x^{2} $|2x| |Square Root|$ \\sqrt{x} $|$ (\\frac{1

0 码力 | 9 页 | 282.15 KB | 2 年前
3
什么是梯度

## PyTorch ## 什么是梯度主讲人：龙良曲 ## Clarification 导数, derive - 偏微分, partial derive 梯度, gradient $$ \nabla f=\left(\frac{\partial f}{\partial x_{1}};\frac{\partial f}{\partial x_{2}};\ldots;\frac{\partial jpg) ![Image](/uploads/documents/4/4/c/a/44ca8475cf66c2e795358aedc2286ff8/p15_6.jpg) ## 下一课时常见函数梯度 ## Thank You

0 码力 | 17 页 | 1.49 MB | 2 年前
3
【PyTorch深度学习-龙龙老师】-测试版202112

6.7 神经网络类型 6.8 油耗预测实战 6.9 参考文献第7章反向传播算法 7.1 导数与梯度 7.2 导数常见性质 7.3 激活函数导数 7.4 损失函数梯度 7.5 全连接层梯度 7.6 链式法则 7.7 反向传播算法 7.8 Himmelblau 函数优化实战 7.9 反向传播算法实战参考文献第10章卷积神经网络 10.1 全连接网络的问题 10.2 卷积神经网络 10.3 卷积层实现 10.4 LeNet-5 实战 10.5 表示学习 10.6 梯度传播 10.7 池化层 10.8 BatchNorm 层 10.9 经典卷积网络 10.10 CIFAR10 与 VGG13 实战 10.11 卷积层变种 10 15 参考文献第11章循环神经网络 11.1 序列表示方法 11.2 循环神经网络 11.3 梯度传播 11.4 RNN 层使用方法 11.5 RNN 情感分类问题实战 11.6 梯度弥散和梯度爆炸 11.7 RNN 短时记忆 11.8 LSTM 原理 11.9 LSTM 层使用方法 11.10

0 码力 | 439 页 | 29.91 MB | 2 年前
3
动手学深度学习 v2.0

4.2 偏导数 ..... 68 2.4.3 梯度 ..... 68 2.4.4 链式法则 ..... 68 2.5 自动微分 ..... 69 2.5.1 一个简单的例子 ..... 70 2.5.2 非标量变量的反向传播 ..... 71 2.5.3 分离计算 ..... 71 2.5.4 Python控制流的梯度计算 ..... 72 2.6 概率 ..... 前向传播计算图 ..... 163 4.7.3 反向传播 ..... 164 4.7.4 训练神经网络 ..... 165 4.8 数值稳定性和模型初始化 ..... 166 4.8.1 梯度消失和梯度爆炸 ..... 166 4.8.2 参数初始化 ..... 168 4.9 环境和分布偏移 ..... 170 4.9.1 分布偏移的类型 ..... 171 4.9.2 分布偏移示例 4 预测 ..... 320 8.5.5 梯度裁剪 ..... 321 8.5.6 训练 ..... 322 8.6 循环神经网络的简洁实现 ..... 325 8.6.1 定义模型 ..... 326 8.6.2 训练与预测 ..... 328 8.7 通过时间反向传播 ..... 329 8.7.1 循环神经网络的梯度分析 ..... 330 8.7.2 通过时间反向传播的细节

0 码力 | 797 页 | 29.45 MB | 2 年前
3
机器学习课程-温州大学-06深度学习-优化算法

本章目录 01 小批量梯度下降 02 优化算法 03 超参数调整和BatchNorm 04 Softmax ### 1. 小批量梯度下降 ## 01 小批量梯度下降 02 优化算法 03 超参数调整和BatchNorm 04 Softmax ## 小批量梯度下降 ## 小批量梯度下降（Mini-Batch Gradient Descent）梯度下降的每一步中，用到了一定批量的训练样本 w_{j},\ (j=0,1,\ldots,n\text{)})\\\end{aligned} $$ b=1 （随机梯度下降,SGD） b=m （批量梯度下降,BGD） b=batch_size，通常是2的指数倍，常见有32,64,128等。 (小批量梯度下降,MBGD) ## 小批量梯度下降 Batch gradient descent ![Image](/uploads/documents ![Image](/uploads/documents/b/5/6/7/b567ec9747c87c33d45000790224cffe/p5_2.jpg) ### 2. 优化算法 01 小批量梯度下降 ## 02 优化算法 03 超参数调整和BatchNorm 04 Softmax ## 伦敦温度的例子 $$ \theta_{1}=40^{\circ}\mathrm{F} $$

0 码力 | 31 页 | 2.03 MB | 2 年前
3
机器学习课程-温州大学-08深度学习-深度卷积神经网络

5190/p11_1.jpg) ### 2. 深度残差网络 01 经典网络 02 深度残差网络 03 其它现代网络 04 卷积神经网络使用技巧 ### 2. 深度残差网络梯度消失和梯度爆炸问题 ![Image](/uploads/documents/7/6/0/7/7607a8e8efef5c4a56eb4c0c25195190/p13_1.jpg) $$ \frac{\partial DenseNet是2017年CVPR会议上提出的一种卷积神经网络结构，其名字来源于“密集连接网络（Densely Connected Network）”。 DenseNet的创新点在于在网络结构中引入了密集连接，使特征复用和梯度传播更加容易，在处理图像分类、目标检测、分割等问题中都取得了不错的结果。 ![Image](/uploads/documents/7/6/0/7/7607a8e8efef5c4a56eb4c0c25195190/p20_1 resnet18(pretrained=True) ### 2. 冻结模型权重 for param in net.parameters(): #遍历每个模型参数 param.requires_grad = False #参数梯度为False # 将最后的全连接层改成十分类 ### 3. 替换全连接层 ## 常见模型 • VGG • ResNet • SqueezeNet • DenseNet • Inception

0 码力 | 32 页 | 2.42 MB | 2 年前
3
深度学习与PyTorch入门实战 - 19.1 单一输出感知机

tensor([[−0.0107, −0.0021, 0.0047, 0.0092, −0.0091, −0.0030, 0.0069, −0.0105, −0.0061, −0.0051]]) ## 下一课时 MLP及梯度 ## Thank You

0 码力 | 8 页 | 548.71 KB | 2 年前
3

共 247 条前往

页

分类

语言

格式

深度学习与PyTorch入门实战 - 50. RNN训练难题

深度学习与PyTorch入门实战 - 18.2 LOSS及其梯度

深度学习与PyTorch入门实战 - 18.1 激活函数梯度

常见函数梯度

什么是梯度

【PyTorch深度学习-龙龙老师】-测试版202112

动手学深度学习 v2.0

机器学习课程-温州大学-06深度学习-优化算法

机器学习课程-温州大学-08深度学习-深度卷积神经网络

深度学习与PyTorch入门实战 - 19.1 单一输出感知机

搜索

分类

语言

格式