-
## PyTorch
## LOSS及其梯度
主讲人:龙良曲
## Typical Loss
## Mean Squared Error
## Cross Entropy Loss
binary
multi-class
+softmax
Leave it to Logistic Regression Part
## MSE
$$ \begin{aligned} ■ loss=\
0 码力 |
14 页 |
989.18 KB
| 2 年前 3
-
## PyTorch
## 激活函数及其梯度
主讲人:龙良曲
## Activation Functions

PITTS WITH LETTVIN: Pitts with Jerome Lettvin and one subject tensor([0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.1111, 0.3333, 0.5556, 0.7778, 1.0000])
## 下一课时 Loss及其梯度
## Thank You
0 码力 |
14 页 |
724.00 KB
| 2 年前 3
-
## PyTorch
## 常见函数梯度
主讲人:龙良曲
## Common Functions
|Common Functions|Function|Derivative|
|---|---|---|
|Constant|c|0|
|Line|x|1|
||ax|a|
|Square|$ x^{2} $|2x|
|Square Root|$ \\sqrt{x} $|$ (\\frac{1
0 码力 |
9 页 |
282.15 KB
| 2 年前 3
-
## PyTorch
## 什么是梯度
主讲人:龙良曲
## Clarification
导数, derive
- 偏微分, partial derive
梯度, gradient
$$ \nabla f=\left(\frac{\partial f}{\partial x_{1}};\frac{\partial f}{\partial x_{2}};\ldots;\frac{\partial jpg)

## 下一课时 常见函数梯度
## Thank You
0 码力 |
17 页 |
1.49 MB
| 2 年前 3
-
0 码力 |
29 页 |
660.51 KB
| 2 年前 3
-
0 码力 |
12 页 |
967.80 KB
| 2 年前 3
-
6.7 神经网络类型
6.8 油耗预测实战
6.9 参考文献
第7章 反向传播算法
7.1 导数与梯度
7.2 导数常见性质
7.3 激活函数导数
7.4 损失函数梯度
7.5 全连接层梯度
7.6 链式法则
7.7 反向传播算法
7.8 Himmelblau 函数优化实战
7.9 反向传播算法实战 参考文献
第10章 卷积神经网络
10.1 全连接网络的问题
10.2 卷积神经网络
10.3 卷积层实现
10.4 LeNet-5 实战
10.5 表示学习
10.6 梯度传播
10.7 池化层
10.8 BatchNorm 层
10.9 经典卷积网络
10.10 CIFAR10 与 VGG13 实战
10.11 卷积层变种
10 10.15 参考文献
第11章 循环神经网络
11.1 序列表示方法
11.2 循环神经网络
11.3 梯度传播
11.4 RNN 层使用方法
11.5 RNN 情感分类问题实战
11.6 梯度弥散和梯度爆炸
11.7 RNN 短时记忆
11.8 LSTM 原理
11.9 LSTM 层使用方法
11
0 码力 |
439 页 |
29.91 MB
| 2 年前 3
-
日游计划,要求包含西湖和灵隐寺,且预算控制在2000元内。”|兼顾目标与细节需避免过度约束|
|启发式提问|通过提问引导模型主动思考(如“为什么”“如何”)|探索性问题、需模型解释逻辑|“为什么选择
梯度下降法解决此优化问题?请对比其他算法。”|触发模型自解释能力可能偏离核心目标|
## 任务需求与提示语策略
| 任务类型 | 适用模型 | 梯度建立
设定主题相关性的层级结构
## TFM实施步骤:
1. 定义主题原型:列出主题的关键特征和代表性例子
2. 构建语义框架:创建与主题相关的概念图
3. 设置重点梯度:按重要性排序相关概念和子主题
4. 创建主题引导符:设计特定的关键词或短语来保持主题聚焦
## 应用示例
1. 主题原型
• 关键特征:全球变暖、极端天气、海平面上升、生态系统变化
• 2. 语义框架

### 3. 重点梯度
(1)气候变化的科学证据
(2) 当前和预期的影响
(3)减缓和适应策略
(4)个人和集体行动的重要性
### 4. 主题引导符
• 主要关键词:气候变化、全球变暖、环境保护
• 次 0 码力 |
104 页 |
5.37 MB
| 1 年前 3
-
日游计划,要求包含西湖和灵隐寺,且预算控制在2000元内。”|兼顾目标与细节需避免过度约束|
|启发式提问|通过提问引导模型主动思考(如“为什么”“如何”)|探索性问题、需模型解释逻辑|“为什么选择
梯度下降法解决此优化问题?请对比其他算法。”|触发模型自解释能力可能偏离核心目标|
## 任务需求与提示语策略
| 任务类型 | 适用模型 | 梯度建立
设定主题相关性的层级结构
## TFM实施步骤:
1. 定义主题原型:列出主题的关键特征和代表性例子
2. 构建语义框架:创建与主题相关的概念图
3. 设置重点梯度:按重要性排序相关概念和子主题
4. 创建主题引导符:设计特定的关键词或短语来保持主题聚焦
## 应用示例
1. 主题原型
• 关键特征:全球变暖、极端天气、海平面上升、生态系统变化
• 2. 语义框架

### 3. 重点梯度
(1)气候变化的科学证据
(2) 当前和预期的影响
(3)减缓和适应策略
(4)个人和集体行动的重要性
### 4. 主题引导符
• 主要关键词:气候变化、全球变暖、环境保护
• 次 0 码力 |
103 页 |
5.40 MB
| 1 年前 3
-
|基础算术|add/multiply/mod/sqrt/sin/trace/fft/argmin|
|数组运算|size/rank/split/reverse/cast/one\_hot/quantize|
|梯度裁剪|clip\_by\_value/clip\_by\_norm/clip\_by\_global\_norm|
|逻辑控制和调试|identity/logical\_and/equal/less 依赖训练集上的数据,面对新数据时就会无所适从,这时模型的泛化能力就会变差。
## 前置知识:损失函数
模型训练的目标是不断最小化经验风险。随着训练步数的增加,经验风险将逐渐降低,模型复杂度也将逐渐上升。为了降低过度训练可能造成的过拟合风险,可以引入专门用来度量模型复杂度的正则化项(regularizer)或惩罚项(penalty term)—J(f)。常用的正则化项有L0、L1和L2范数。因此, 最优解或达到预设的收敛条件。
不同的优化算法采用的迭代策略各有不同:
有的使用目标函数的一阶导数,如梯度下降法;
有的使用目标函数的二阶导数,如牛顿法;
有的使用前几轮迭代的信息,如Adam。
## 前置知识:优化算法
## 极客时间
基于梯度下降法的迭代策略最简单,它直接沿着梯度负方向,即目标函数减小最快的方向进行直线搜索。其计算表达式如下:
$$ x_{k+1}=x_{k}-\alpha*grad(x_{k})
0 码力 |
50 页 |
25.17 MB
| 2 年前 3