搜索

pdf文档 深度学习与PyTorch入门实战 - 05. 手写数字问题

569.56 KB 10 页 1 下载 67 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pdf
3
摘要
文档介绍了使用PyTorch进行手写数字识别的问题。主要内容包括MNIST数据集的基本情况(60,000训练图像和10,000测试图像),神经网络的结构设计(包括输入层、隐藏层和输出层),以及通过梯度下降方法最小化均方误差损失函数的训练过程。文档还展示了神经网络在手写数字识别中的推理过程。
AI总结
## 总结 1. **MNIST 数据集** - MNIST 是一个经典的手写数字数据集,包含 0-9 的数字图像。 - 每个数字有 7000 张图像,其中训练集 60000 张,测试集 10000 张。 2. **深度学习与函数映射** - 深度学习的本质是通过多层函数映射实现从输入到输出的非线性关系。 - 神经网络结构: - 输入层 (X): 784 维(28x28 图像展平) - 隐藏层 (H1, H2): 具有可学习的权重矩阵 W 和偏置 b - 输出层 (H3): 10 维(对应 0-9 的数字) - 例如:输入一个数字图像,输出一个长度为 10 的向量(如数字 1 对应 `[0,1,0,...,0]`)。 3. **损失函数** - 使用欧氏距离(均方误差)衡量预测值与真实值的差异。 $$ \text{Loss} = \sum (pred - Y)^2 $$ 4. **梯度下降** - 通过梯度下降优化算法,最小化损失函数,更新权重和偏置参数。 - 优化目标: $$ \min_{W1, W2, W3, b1, b2, b3} \text{Loss} $$ 5. **推理过程** - 对于新的输入图像 X,通过网络前向传播得到预测结果 pred。 $$ pred = W3 \cdot \{ W2 \cdot (W1 \cdot X + b1) + b2 \} + b3 $$ - 最终输出为 pred 中最大值对应的类别(argmax)。 --- **核心观点**: - MNIST 数据集是手写数字识别的经典数据集,适合深度学习入门。 - 神经网络通过多层非线性变换实现从输入到输出的映射,梯度下降用于优化模型参数。 - 深度学习的目标是通过训练模型实现对新数据的准确预测。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 3 页请下载阅读 -
文档评分
请文明评论,理性发言.