《Efficient Deep Learning Book》[EDL] Chapter 7 - Automation
0 码力 | 33 页 | 2.48 MB | 2 年前文档讨论了深度学习中的自动化技术,特别是超参数优化(HPO)和自动机器学习(AutoML)。传统上,超参数调优依赖专家经验和试错法,但这种方法在快速变化的环境中效率低下。为解决此问题,超参数优化技术应运而生,通过自动化搜索最佳超参数组合来提升模型性能。文档还介绍了AutoML的概念,旨在自动化机器学习 pipeline 的大部分步骤,减少对专家的依赖。通过案例展示了如何使用自动化工具(如Keras Tuner、Ray Tune等)来优化模型,包括量化、聚类和数据增强等技术。文档强调了在深度学习中,超参数不仅影响模型性能,还涉及训练过程的多个方面,如数据增强和网络架构配置。最后,文档提到了模型搜索空间的概念,并通过案例展示了如何在实际应用中配置和优化模型。
《Efficient Deep Learning Book》[EDL] Chapter 6 - Advanced Learning Techniques - Technical Review
0 码力 | 31 页 | 4.03 MB | 2 年前文档详细介绍了高级学习技术,重点讨论了自监督学习(Self-Supervised Learning)、标签平滑(Label Smoothing)、课程学习(Curriculum Learning)、子类蒸馏(Subclass Distillation)和随机深度(Stochastic Depth)等技术。自监督学习通过利用未标记数据提高模型性能,减少对大量标注数据的依赖。标签平滑通过降低模型对标签的过度自信来防止过拟合。课程学习通过逐步增加训练难度来提升模型质量。子类蒸馏专注于小类问题,通过调整蒸馏方法提高分类性能。随机深度通过随机禁用部分网络层来缓解深层网络的梯度消失问题,同时提高训练效率和模型泛化能力。这些技术在不增加计算资源消耗的情况下,显著提升了模型的质量和效率。
《Efficient Deep Learning Book》[EDL] Chapter 5 - Advanced Compression Techniques
0 码力 | 34 页 | 3.18 MB | 2 年前文档介绍了两种高级压缩技术:稀疏性和聚类。稀疏性通过移除不重要的网络连接和节点来减少模型大小,同时保持性能,具有正则化效果。聚类通过将权重分成簇,每个簇使用相同值,减少存储需求。量化将权重映射到较少的可能值,但可能在数据分布不均匀时效果不佳。聚类在压缩比和重建误差方面优于量化,适用于嵌入表等应用。文档还讨论了稀疏性和聚类的硬件支持及其在模型压缩中的潜力。
《Efficient Deep Learning Book》[EDL] Chapter 4 - Efficient Architectures
0 码力 | 53 页 | 3.92 MB | 2 年前本章聚焦于高效架构,旨在通过新颖方式减少模型体积并提升推理效率,同时保持大型模型的问题解决能力。首先介绍了嵌入(Embedding),它通过将高维概念压缩为低维向量表示,实现降维并度量输入相似性。嵌入表可复用,其质量取决于嵌入维度d和词汇表大小N。其次介绍了注意力机制(Attention),它利用词间关联性辅助学习,是Transformer等先进模型的核心,但具有二次复杂度。为应对此问题,出现了多种高效Transformer变体,如分块、稀疏注意力和低秩方法。最后介绍了深度可分离卷积(DSC),它通过两步卷积降低计算复杂度,输出形状与常规卷积相同,适合移动设备。项目示例展示了DSC模型在质量略低于常规卷积但体积减少约3倍,可适配于内存受限环境。高效架构可与量化、蒸馏等技术结合,提供更优的体积-质量权衡。
《Efficient Deep Learning Book》[EDL] Chapter 3 - Learning Techniques
0 码力 | 56 页 | 18.93 MB | 2 年前本章介绍了两种重要的基准指标来衡量训练效率,并提出了一系列学习技术来提升这些基准指标。数据增强技术通过引入样本扰动和标签混合来扩展训练数据集,从而提高模型性能。蒸馏技术则通过将大型模型或模型集合的知识传递给更小的模型,提升目标模型的准确性和收敛速度。这些技术不仅能够减少训练成本,还能在资源受限的环境中(如移动和边缘设备)实现更小的模型 footprint。通过编程项目,读者可以实践这些技术并验证其益处。
《Efficient Deep Learning Book》[EDL] Chapter 2 - Compression Techniques
0 码力 | 33 页 | 1.96 MB | 2 年前文档详细介绍了深度学习中的压缩技术,特别是量化(Quantization)方法。量化通过将模型参数从高精度(如32位浮点数)转换为低精度(如8位整数)来减少模型大小和推理延迟,同时保持性能。文档通过实例展示了量化如何成功应用于模型压缩,例如将模型大小减少4倍,同时保持与原模型几乎相同的准确性。量化在资源受限的环境中(如移动设备)部署深度学习模型尤为重要。
《Efficient Deep Learning Book》[EDL] Chapter 1 - Introduction
0 码力 | 21 页 | 3.17 MB | 2 年前The chapter introduces the concept of efficient deep learning, emphasizing the need for optimizing both training and deployment of deep learning models. It discusses key areas such as compression techniques, learning techniques, automation, efficient models, and infrastructure. The chapter highlights the trade-offs between quality metrics (e.g., accuracy, precision) and footprint metrics (e.g., size, latency, memory). Techniques like quantization and neural architecture search are introduced to improve model efficiency. The importance of hardware infrastructure, including GPUs and TPUs, is also covered to accelerate training and inference. The chapter sets the stage for deeper exploration of these topics in subsequent chapters.
人工智能发展史
0 码力 | 54 页 | 3.87 MB | 2 年前文档详细介绍了人工智能的发展历程,特别是深度学习和强化学习领域的突破性进展。内容重点介绍了AlphaZero和Deep Q-Network等代表性模型,展示了人工智能在复杂任务中的学习能力。通过Volodymyr Mnih等人的研究,文档指出深度Q网络在49种游戏中超越人类的表现,证明了人工智能在高维感知输入和动作控制之间的桥梁作用。此外,文档还提到了Backpropagation on GPU在加速深度学习中的重要性。
PyTorch Release Notes
0 码力 | 365 页 | 2.94 MB | 2 年前文档详细记录了PyTorch多个版本的发布说明,包括18.04到18.11等版本的更新内容。每个版本更新包括了PyTorch容器镜像的改进、CUDA、cuDNN、NCCL、DALI等库的版本升级,以及新功能的引入,如多GPU性能优化、混合精度训练支持、JIT改进等。此外,文档还提供了Tensor Core优化的示例,包括ResNet50和GNMT v2模型的实现。已知问题部分提到了与持久批归一化相关的预测能力下降问题,并提供了相应的解决方案。
Machine Learning Pytorch Tutorial
0 码力 | 48 页 | 584.86 KB | 2 年前文档主要介绍了PyTorch这一机器学习框架的基本概念和使用方法。PyTorch具有N维张量计算和自动微分两个主要功能,适用于深度学习。文档详细讲解了PyTorch的核心组件,包括数据集与数据加载器、张量操作、神经网络模型定义、损失函数以及优化算法。此外,还介绍了PyTorch在训练和测试神经网络时的步骤,包括数据加载、模型定义、损失函数选择、优化算法设置以及模型保存与加载。文档还提到了PyTorch在自然语言处理、计算机视觉等领域的应用,并提供了相关资源和参考文献。
共 30 条
- 1
- 2
- 3













