机器学习课程-温州大学-05深度学习-深度学习实践数的值) 3. 选取代价函数值最小的模型 4. 用步骤3中选出的模型对测试 集计算得出推广误差(代价函数 的值) 5 数据集制作 PyTorch的dataloader是用于读取训练数据的工具,它可以自动将数据分割 成小batch,并在训练过程中进行数据预处理。 6 数据集制作 class MyDataset(Dataset): def __init__(self, data): 获得更多的训练数据 使用更多的训练数据是解决过拟合问题最有效的手段,因为更多的样本能够让模型学习 到更多更有效的特征,减小噪声的影响。 2.降维 即丢弃一些不能帮助我们正确预测的特征。可以是手工选择保留哪些特征,或者使用一 些模型选择的算法来帮忙(例如PCA)。 3.正则化 正则化(regularization)的技术,保留所有的特征,但是减少参数的大小(magnitude) ,它可以改善或者减少过拟合问题。0 码力 | 19 页 | 1.09 MB | 1 年前3
动手学深度学习 v2.0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290 8.1.1 统计工具 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290 8.1.2 训练 . 微调BERT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 738 16 附录:深度学习工具 741 16.1 使用Jupyter Notebook . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 实世界的应用范围很窄。而那些应用,例如语音识别和计算机视觉,需要大量的领域知识,以至于它们通常 被认为是完全独立的领域,而机器学习对这些领域来说只是一个小组件。因此,神经网络——我们在本书中 关注的深度学习模型的前身,被认为是过时的工具。 就在过去的五年里,深度学习给世界带来了惊喜,推动了计算机视觉、自然语言处理、自动语音识别、强化学 习和统计建模等领域的快速发展。有了这些进步,我们现在可以制造比以往任何时候都更自主的汽车(不过0 码力 | 797 页 | 29.45 MB | 1 年前3
QCon2018北京-基于深度学习的视频结构化实践-姚唐仁2017中国网络视频用户情况 ����2017������������� 传统视频摘要 vs AI视频结构化 内容不完整 依赖经验 实时性差 时效性差 识别范围广 效率高 可迭代 创新基础 传统手工摘要 AI视频结构化 视频结构化场景 视频分解 基础模型要素 ��1�01:02:03-01:10:05� ��1����� �� �� �� ���XX�� ����0 码力 | 39 页 | 38.01 MB | 1 年前3
机器学习课程-温州大学-08深度学习-深度卷积神经网络X 120 84 10 F C FC2 LeNet-5 32x32x1 400 6 AlexNet • 2012年,AlexNet 横空出世。它首次证 明了学习到的特征可以超越手工设计 的特征。它一举了打破计算机视觉研 究的现状。 AlexNet 使用了8层卷积神 经网络,并以很大的优势赢得了2012 年 ImageNet 图像识别挑战赛。 LeNet (左), AlexNet0 码力 | 32 页 | 2.42 MB | 1 年前3
Qcon北京2018-《文本智能处理的深度学习技术》-陈运文深度学习算法 输入数据 特征工程 传统机器学习算法 非常耗费时间 以文本分类过程举例,常见 的特征提取算法包括: 词频 TF-IDF 互信息 信息增益 期望交叉熵 主成分分析 … 特征工程需要手工寻找特 征,花费大量人力,特征的 好坏往往决定最终结果 深度学习基础结构 基础神经元结构 多个神经元连接组成神经网络 字词表示 计算机 电脑 [ 0, 0, 0, 0, 1, 0, 0,0 码力 | 46 页 | 25.61 MB | 1 年前3
机器学习课程-温州大学-05机器学习-机器学习实践获得更多的训练数据 使用更多的训练数据是解决过拟合问题最有效的手段,因为更多的样本能够让模型学习 到更多更有效的特征,减小噪声的影响。 2.降维 即丢弃一些不能帮助我们正确预测的特征。可以是手工选择保留哪些特征,或者使用一 些模型选择的算法来帮忙(例如PCA)。 3.正则化 正则化(regularization)的技术,保留所有的特征,但是减少参数的大小(magnitude) ,它可以改善或者减少过拟合问题。0 码力 | 33 页 | 2.14 MB | 1 年前3
机器学习课程-温州大学-02机器学习-回归获得更多的训练数据 使用更多的训练数据是解决过拟合问题最有效的手段,因为更多的样本能够让模型学习 到更多更有效的特征,减小噪声的影响。 2.降维 即丢弃一些不能帮助我们正确预测的特征。可以是手工选择保留哪些特征,或者使用一 些模型选择的算法来帮忙(例如PCA)。 3.正则化 正则化(regularization)的技术,保留所有的特征,但是减少参数的大小(magnitude) ,它可以改善或者减少过拟合问题。0 码力 | 33 页 | 1.50 MB | 1 年前3
【PyTorch深度学习-龙龙老师】-测试版202112参考文献 第 8 章 PyTorch 高级用法 8.1 常见功能模块 8.2 模型装配、训练与测试 8.3 模型保存与加载 8.4 自定义类 8.5 模型乐园 8.6 测量工具 8.7 可视化 8.8 参考文献 第 9 章 过拟合 9.1 模型的容量 9.2 过拟合与欠拟合 9.3 数据集划分 9.4 模型设计 9.5 正则化 9 图 1.20 百度 Apollo 自动驾驶汽车④ 1.5 深度学习框架 工欲善其事,必先利其器。在介绍了深度学习相关背景知识后,现在来挑选一下实现 深度学习算法所使用的工具吧。 1.5.1 主流框架 ❑ Theano 是最早的深度学习框架之一,由 Yoshua Bengio 和 Ian Goodfellow 等人开发, ③ 图片来自 https://www PyTorch 在工业部署上也有成 熟的 ONNX 生态,丝毫不逊色于 TensorFlow。 1.5.3 功能演示 深度学习的核心是算法的设计思想,深度学习框架只是我们实现算法的工具。对工具 的理解有助于加深对算法的掌握程度。下面将演示 PyTorch 深度学习框架的三大核心功 能,从而帮助我们理解框架在算法设计中扮演的角色。 1) 加速计算 神经网络本质上由大量的矩0 码力 | 439 页 | 29.91 MB | 1 年前3
AI大模型千问 qwen 中文文档72B; • 针对每种尺寸提供基础模型和 Chat 模型,并确保聊天模型按照人类偏好进行校准; • 对基础模型和 Chat 模型的多语言支持 • 基础模型和聊天模型都支持多种语言; • 支持工具调用、RAG(检索增强文本生成)、角色扮演、AI Agent 等; 想了解更多信息,欢迎访问: • 博客 • GitHub • Hugging Face • ModelScope • Qwen1 qwen7b 1.6 Text Generation Web UI Text Generation Web UI(简称 TGW,通常被称为“oobabooga”)是一款流行的文本生成 Web 界面工具,类似 于 AUTOMATIC1111/stable-diffusion-webui 。它拥有多个交互界面,并支持多种模型后端,包括 Transformers 、 llama.cpp(通过 llama-cpp-python 1.7 AWQ 对于量化模型,我们推荐使用 AWQ 结合 AutoAWQ 。AWQ 即激活感知权重量化,是一种针对 LLM 的低比 特权重量化的硬件友好方法。而 AutoAWQ 是一个易于使用的工具包,专门用于 4 比特量化模型。相较于 FP16,AutoAWQ 能够将模型的运行速度提升 3 倍,并将内存需求降低至原来的 1/3。AutoAWQ 实现了激活 感知权重量化(AWQ)算法,可用于 LLM0 码力 | 56 页 | 835.78 KB | 1 年前3
机器学习课程-温州大学-01机器学习-引言1、一个强大的N维数组对象Array; 2、比较成熟的(广播)函数库; 3、用于整合C/C++和Fortran代码的工具包; 4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy 配合使用更加方便。 NumPy(Numeric Python)提供了许多高级的数值编程工具,如:矩阵数据类型、 矢量处理,以及精密的运算库。专为进行严格的数字处理而产生。多为很多大型金融 公 Python模块-NumPy 广播 62 Python模块-Pandas ⚫Pandas Pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而 创建的。 Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型 数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的 函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分 析环境的重要因素之一。 Python模块-SciPy ⚫SciPy SciPy是构建在NumPy的基础之上的,它 提供了许多的操作NumPy的数组的函数。 SciPy是一款方便、易于使用、专为科学和 工程设计的Python工具包,它包括了统计 、优化、整合以及线性代数模块、傅里叶 变换、信号和图像图例,常微分方差的求 解等 scipy.cluster 向量量化 scipy.constants 数学常量 scipy0 码力 | 78 页 | 3.69 MB | 1 年前3
共 28 条
- 1
- 2
- 3













