预编译合约 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Keras: 基于 Python 的深度学习库

. . . . 8 3.1.2 指定输入数据的尺寸 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3.1.3 编译 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 3.1.4 训练 . . . 33 3.3.16 如何从 Sequential 模型中移除一个层？ . . . . . . . . . . . . . . . . . . . . 34 3.3.17 如何在 Keras 中使用预训练的模型？ . . . . . . . . . . . . . . . . . . . . . . 35 3.3.18 如何在 Keras 中使用 HDF5 输入？ . . . . . . . . 156 12.7 Boston 房价回归数据集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 13 预训练模型 Applications 158 13.1 可用的模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

0 码力 | 257 页 | 1.19 MB | 1 年前
3
动手学深度学习 v2.0

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 497 12 计算性能 503 12.1 编译器和解释器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503 12.1 读取数据集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644 13.14.4 微调预训练模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644 13.14.5 定义训练函数 . 646 13.14.7 对测试集分类并在Kaggle提交结果 . . . . . . . . . . . . . . . . . . . . . . . . . . . 647 14 自然语言处理：预训练 649 14.1 词嵌入（word2vec） . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

0 码力 | 797 页 | 29.45 MB | 1 年前
3
【PyTorch深度学习-龙龙老师】-测试版202112

梯度弥散和梯度爆炸 11.7 RNN 短时记忆 11.8 LSTM 原理 11.9 LSTM 层使用方法 11.10 GRU 简介 11.11 LSTM/GRU 情感分类问题再战 11.12 预训练的词向量 11.13 参考文献第 12 章自编码器 12.1 自编码器原理 12.2 MNIST 图片重建实战 12.3 自编码器变种 12.4 变分自编码器 1.2 机器学习的分类有监督学习有监督学习的数据集包含了样本?与样本的标签?，算法模型需要学习到映射关系??: ? → ?，其中??代表模型函数，?为模型的参数。在训练时，通过计算模型的预测值??(?)与真实标签?之间的误差来优化网络参数?，使得网络下一次能够预测更精准。常见的有监督学习有线性回归、逻辑回归、支持向量机、随机森林等。无监督学习收集带标签的数据往往代价较为昂贵，对于只有样本 1997 LSTM 2006 DBN深度置信网络图 1.8 浅层神经网络发展时间线 1.2.2 深度学习 2006 年，Geoffrey Hinton 等人发现通过逐层预训练的方式可以较好地训练多层神经网络，并在 MNIST 手写数字图片数据集上取得了优于 SVM 的错误率，开启了第三次人工智能的复兴。在论文中，Geoffrey Hinton 首次提出了 Deep

0 码力 | 439 页 | 29.91 MB | 1 年前
3
机器学习课程-温州大学-07机器学习-决策树

样就可能对训练样本学习的“太好”了，把训练样本的一些特点当做所有数据都具有的一般性质，从而导致过拟合。剪枝的基本策略有“预剪枝”（prepruning）和“后剪枝”（post-pruning）通过剪枝处理去掉一些分支来降低过拟合的风险。 20 C4.5的剪枝预剪枝（prepruning）预剪枝不仅可以降低过拟合的风险而且还可以减少训练时间，但另一方面它是基于“贪心” 策略，会带来欠拟合风险。硬滑否 11 浅白硬挺清脆模糊平坦硬滑否 12 浅白蜷缩浊响模糊平坦软粘否 13 青绿稍蜷浊响稍糊凹陷硬滑否训练集验证集 21 C4.5的剪枝预剪枝基于表生成未剪枝的决策树平坦纹理色泽好瓜坏瓜根蒂色泽脐部坏瓜坏瓜坏瓜坏瓜好瓜好瓜好瓜好瓜好瓜乌黑凹陷硬挺稍糊清晰节点划分前准确率比划分后准确率高。 22 C4.5的剪枝预剪枝平坦坏瓜脐部凹陷稍凹 ① ④ ③ ② 好瓜好瓜验证集精度脐部=? 划分前:42.9% 划分后:71.4% 预剪枝决策:划分验证集精度根蒂=? 划分前:71.4% 划分后:71.4% 预剪枝决策:禁止划分验证集精度色泽=? 划分前:71.4% 划分后:57.1% 预剪枝决策:禁止划分 {1,2,3,14}

0 码力 | 39 页 | 1.84 MB | 1 年前
3
机器学习课程-温州大学-12深度学习-自然语言处理和词嵌入

其相关的负样本）,并再次执行相同的过程。当我们循环遍历整个数据集多次时，嵌入继续得到改进。然后我们可以停止训练过程，丢弃`Context`矩阵，并使用`Embeddings`矩阵作为下一个任务的预训练嵌入。 27 4.GloVe 03 Word2Vec 04 GloVe 02 词嵌入 05 GPT 01 词汇表征和文本数据处理 28 4.GloVe 2 29 5.情感分类 03 Word2Vec 04 GloVe 02 词嵌入 05 GPT 01 词汇表征和文本数据处理 30 预训练模型的发展 31 预训练模型的发展 32 Transformer 资料来源：《Attention Is All You Need》,Ashish Vaswani et.al 2017 ◼ Transf 章续写）整段文本生成产品特色通过随机Mask(即遮挡)数据库文本中的词语或语段，让神经网络自主学习复原被遮挡部分，从而拥有“猜测”缺失内容的能力，产出预训练模型。再通过大规模预训练模型理解上文或给定条件，从概率层面推测最符合要求的输出结果。其本质是借助超大规模的训练参数猜测上下文的过程文本风格主流思路是分离文本属性及文本内容迁移隐式方法即使用某类无监督学习学习或强化学

0 码力 | 44 页 | 2.36 MB | 1 年前
3
机器学习课程-温州大学-14深度学习-Vision Transformer (ViT)

Embedding 就是把每个Patch再经过一个全连接网络压缩成一定维度的向量。 1.背景知识 7 为什么需要用transformer CNN（如ResNet）是图像分类的最佳解决方案。如果预训练的数据集足够大（至少一亿张图像），则Vision Transformer （ViT）将击败CNN（小幅度） Vision Transformer（ViT）实际上就是Transformer的encode网络。 25 3.模型训练策略训练策略模型在Dataset A上预训练，在Dataset B上精调，在Dataset B上评估 26 数据集介绍在ImageNet(small)预训练，ViT的效果低于Resnet。在ImageNet-21K(medium)预训练，ViT的效果接近Resnet。在JFT(large)预训练，ViT的效果优于Resnet。 3.模型训练策略 27

0 码力 | 34 页 | 2.78 MB | 1 年前
3
阿里云上深度学习建模实践-程孟力

 智能标注  自监督学习  多模态预训练  小样本学习解决方案: 智能标注系统iTags 智能抠图智能抠图智能贴合智能预标注 + 人机协同解决方案: 自监督学习 Moby: swin-transformer based moco. Image features 推荐模型特征图像搜索解决方案: 多模态预训练 Swin transformer based sform er decoder Tran sform er decoder Tran sform er decoder Tran sform er decoder 解决方案: 多模态预训练 Vit based 下游任务:  视频分类  视频打标签  推荐模型特征解决方案: 小样本学习小样本结构化模型在线预测服务（EAS） • 一键部署 • 多模型 •

0 码力 | 40 页 | 8.51 MB | 1 年前
3
机器学习课程-温州大学-13深度学习-Transformer

Transformer的训练 02 Transformer的工作流程 04 BERT 48 4.BERT NLP 预训练模型的发展语言模型 word2vec glove fasttext elmo openAI-GPT BERT 词嵌入阶段预训练模型阶段 2003年 Bengio 2013年 Mikolov 2014年 Jeffrey 2018年2月 Allen Encoder BERT是一个算法模型，它的出现打破了大量的自然语言处理任务的记录。在BERT的论文发布不久后，Google的研发团队还开放了该模型的代码，并提供了一些在大量数据集上预训练好的算法模型下载方式，这使得所有人都可以通过它来构建一个涉及NLP的算法模型，节约了大量训练语言模型所需的时间，精力，知识和资源 51 4.BERT BERT—模型结构特点： 1

0 码力 | 60 页 | 3.51 MB | 1 年前
3
全连接神经网络实战. pytorch 版

模块是用来导入数据的：torch.utils.data.Dataset 以及 torch.utils.data.DataLoader。 Dataset 存储样本以及它们的标签等信息，Dataset 可以使用预加载的数据集（例如 mnist），也可以使用自定义的数据集；而 DataLoader 是把样本进行访问和索引的工具，它实现了迭代器功能，也就是说它可以依次将 batch_size 数量的样本导出。前面说过，Dataset 可以存储自定义数据，我们可以继承 Dataset 类，在子类中实现一些固定功能的函数，这样就相当于封装了自己的数据为 Dataset 类型。为了方便起见，我们先描述如何使用预加载数据，然后第二章就开始构建神经网络模型。等第四章我们再描述如何自定义数据集。我们一次写一个完整的程序来把数据可视化一下： from torchvision import datasets from optimizer ’ ] ) epochs = checkpoint [ ’ epoch ’ ] # 再训练 1000 轮（或者不再训练，而是直接使用模型来预测，取决于你的需求） f or t in range ( epochs , epochs +1000) : print ( f ”Epoch␣{ t+1}\n−−−−−−−−−−−

0 码力 | 29 页 | 1.40 MB | 1 年前
3
华为云深度学习在文本分类中的实践-李明磊

神经网络NLP里程碑： Word2vec 2013 CNN RNN 2014左右 Attention 2014 Elmo, Bert 2018 解决维度灾难预训练+微调注意力机制端到端训练符号-向量 8 预训练+微调大规模语料训练通用语言模型在目标语料上微调语言模型在目标语料上训练分类器 … … BERT E[ C E1 T1 E2 T2

0 码力 | 23 页 | 1.80 MB | 1 年前
3

共 25 条前往

页

分类

语言

格式