AutoEncoder自编码器jpg)  Output ## Dropout AutoEncoders  (a) [Image](/uploads/documents/4/d/4/8/4d48c77d380b9345c2dae434d12fe818/p13_2.jpg) (b) After applying dropout.   ## ☐ ☐ ☐ net_dropped = torch.nn.Sequential( torch.nn.Linear(784, 200), torch.nn.Dropout(0.5), #0 码力 | 16 页 | 1.15 MB | 2 年前3
动手学深度学习 v2.0权重衰减 ..... 149 4.5.1 高维线性回归 ..... 151 4.5.2 从零开始实现 ..... 151 4.5.3 简洁实现 ..... 153 4.6 暂退法 (Dropout) ..... 156 4.6.1 重新审视过拟合 ..... 156 4.6.2 扰动的稳健性 ..... 157 4.6.3 实践中的暂退法 ..... 157 4.6.4 从零开始实现 361 9.5.5 训练模型 ..... 362 9.6 编码器-解码器架构 ..... 364 9.6.1 编码器 ..... 364 9.6.2 解码器 ..... 365 9.6.3 合并编码器和解码器 ..... 365 9.7 序列到序列学习 (seq2seq) ..... 366 9.7.1 编码器 ..... 367 9.7.2 解码器 ..... 369 多头注意力 ..... 404 10.5.1 模型 ..... 404 10.5.2 实现 ..... 405 10.6 自注意力和位置编码 ..... 408 10.6.1 自注意力 ..... 408 10.6.2 比较卷积神经网络、循环神经网络和自注意力 ..... 409 10.6.3 位置编码 ..... 410 10.7 Transformer ..... 4130 码力 | 797 页 | 29.45 MB | 2 年前3
【PyTorch深度学习-龙龙老师】-测试版2021128.7 可视化 8.8 参考文献 第9章 过拟合 9.1 模型的容量 9.2 过拟合与欠拟合 9.3 数据集划分 9.4 模型设计 9.5 正则化 9.6 Dropout 9.7 数据增强 9.8 过拟合问题实战 9.9 参考文献 第10章 卷积神经网络 10.1 全连接网络的问题 10.2 卷积神经网络 10.3 卷积层实现 10 LSTM/GRU 情感分类问题再战 11.12 预训练的词向量 11.13 参考文献 第12章 自编码器 12.1 自编码器原理 12.2 MNIST 图片重建实战 12.3 自编码器变种 12.4 变分自编码器 12.5 VAE 实战 12.6 参考文献 第13章 生成对抗网络 13.1 博弈学习实例 身作为监督信号,即模型需要学习的映射为 $ f_{\theta}:x\to x $ ,称为自监督学习(Self-supervised Learning)。在训练时,通过计算模型的预测值 $ f_{\theta}(x) $ 与自身x之间的误差来优化网络参数 $ \theta $ 。常见的无监督学习算法有自编码器、生成对抗网络等。 强化学习也称为增强学习,通过与环境进行交互来学习解决问题的策略的一类0 码力 | 439 页 | 29.91 MB | 2 年前3
Hello Agents V1.0.2 (从零开始构建智能体)你将收获什么? Datawhale 开源免费 完全免费学习本项目所有内容,与社区共同成长 理解核心原理深入理解智能体的概念、历史与经典范式 亲手实现掌握热门低代码平台和智能体代码框架的使用 自研框架HelloAgents 基于 Openai 原生 API 从零构建一个自己的智能体框架 掌握高级技能一步步实现上下文工程、Memory、协议、评估等系统性技术 -模型训练掌握 Agentic 等主流框架的应用。最终,我们还会带你从零开始构建一个属于自己的智能体框架,让你兼具“用轮子”与“造轮子”的能力。 第三部分:高级知识扩展(第八章~第十二章),在这一部分,你的智能体将“学会”思考与协作。我们将使用第二部分的自研框架,深入探索记忆与检索、上下文工程、Agent训练等核心技术,并学习多智能体间的通信协议。最终,你将掌握评估智能体系统性能的专业方法。 第四部分:综合案例进阶(第十三章~第十五章),这里是理论 论 关于 Datawhale 扫描二维码关注 Datawhale 公众号,获取更多优质开源内容 开源协议 本作品采用知识共享署名-非商业性使用-相同方式共享4.0国际许可协议进行许可。 前言 自2022年底以来,以ChatGPT为代表的大语言模型(Large Language Model,LLM)如同一场技术海啸,彻底改变了我们与人工智能交互的方式。LLM强大的自然语言理解和生成能力,让我们0 码力 | 633 页 | 58.72 MB | 1 月前3
2022年美团技术年货 合辑清华大学崔鹏:因果启发的学习、推断和决策 NeurIPS 2021 | Twins:重新思考高效的视觉注意力模型设计 美团获得小样本学习榜单 FewCLUE 第一! Prompt Learning+ 自训练实战 353 DSTC10 开放领域对话评估比赛冠军方法总结 368 KDD 2022 | 美团技术团队精选论文解读 382 ACM SIGIR 2022 | 美团技术团队精选论文解读 行了思考和优化,设计了新的检测框架 -YOLOv6,初衷来自于解决工业应用落地时所遇到的实际问题。 在打造 YOLOv6 框架的同时,我们探索和优化了一些新的方法,例如基于硬件感知神经网络设计思想自研了 EfficientRep Backbone、Rep-Neck 和 Efficient Decoupled Head,同时也吸收借鉴了学术界和工业界的一些前沿进展和成果,例如 Anchor-free、SimOTA 生态,主要工作包括以下几个方面: 1) 完善 YOLOv6 全系列模型,持续提升检测性能。2) 在多种硬件平台上,设计硬件友好的模型。3) 支持 ARM 平台部署以及量化蒸馏等全链条适配。4) 横向拓展和引入关联技术,如半监督、自监督学习等等。5) 探索 YOLOv6 在更多的未知业务场景上的泛化性能。 同时也欢迎社区同学加入我们,共同建设一个适合工业应用的更快更准的目标检测框架。 ### 5. 参考文献 [1] YOLOv50 码力 | 1356 页 | 45.90 MB | 2 年前3
2020美团技术年货 算法篇运算,还是底层的 GPU 卡的加速,业界和美团内部都有比较好的实践。美团也提供了高性能的 TF-Serving 服务(参见《基于 TensorFlow Serving 的深度学习在线预估》一文)以及自研的 MLX 模型打分服务,都可以进行高性能的 Batch 打分。基于此,我们针对不同的模型,采取不同的策略: - 深度学习模型:特征多,计算复杂,性能要求高;我们将计算过程放到公司统一提供的 TF-Serving/MLX 是谷歌在论文《Attention is all you need》 $ ^{[1]} $ 中提出来解决 Sequence to Sequence 问题的模型,其本质上是一个编解码(Encoder-Decoder)结构,编码器 Encoder 由 6 个编码 block 组成,Encoder 中的每个 block 包含 Multi-Head Attention 和 FFN(Feed-Forward Network);同样解码器 bf{E}+Dropout(MH(\mathbf{E}))) $$ $$ \mathbf{F}=LayerNorm(\mathbf{S}^{\prime}+Dropout(Relu(\mathbf{S}^{\prime}\mathbf{W}^{(1)}+b^{(1)})\mathbf{W}^{(2)}+b^{(2)})) $$ Transformer Layer 就是通过这种自注意力机制层0 码力 | 317 页 | 16.57 MB | 2 年前3
Keras: 基于 Python 的深度学习库5.2 核心网络层 ..... 59 5.2.1 Dense [source] ..... 59 5.2.2 Activation [source] ..... 60 5.2.3 Dropout [source] ..... 60 5.2.4 Flatten [source] ..... 60 5.2.5 Input [source] ..... 61 5.2.6 Reshape softmax 多分类: import keras from keras.models import Sequential from keras.layers import Dense, Dropout, Activation from keras.optimizers import SGD # 生成虚拟数据 import numpy as np x_train = np.random.random((1000 add(Dense(64, activation='relu', input_dim=20)) model.add(Dropout(0.5)) model.add(Dense(64, activation='relu')) model.add(Dropout(0.5)) model.add(Dense(10, activation='softmax')) sgd0 码力 | 257 页 | 1.19 MB | 2 年前3
ffmpeg翻译文档表达式计算/求值 9 OpenGL 选项 10 编码选项 11 解码器 12 视频解码 13 音频解码 14 字幕解码 15 编码 16 音频编码器 17 视频编码器 18 字幕编码器 19 比特流滤镜(过滤器) 20 格式选项 21 分离器(解复用) 22 混合器 23 元数据 24 协议 25 设备选项 26 输入设备 OpenGL 选项 - 10 编码选项 - 11 解码器 - 12 视频解码 - 13 音频解码 - 14 字幕解码 - 15 编码 - 16 音频编码器 - 17 视频编码器 - 18 字幕编码器 - 19 比特流滤镜(过滤器) - 20 格式选项 - 21 分离器(解复用) - 22 混合器 - 23 元数据 - 24 协议 - 25 设备选项 很多选项是作用于单独的流的,例如码率(bitrate)或者编码(codec),流说明符就是精确的为每个流指定相应的选项。 一个流说明符是一个以冒号分隔的字符串,其中分隔出的部分是附加选项,例如 -codec 1 ac3 表示编码器是对第2音频流以ac3编码。 一个流说明符可能匹配多个流,则该选项是所有匹配项的选项,例如 -b:a 128k 表示所有的音频流都是128k的码率。 一个空的流说明符匹配所有的流,例如 `-codec0 码力 | 502 页 | 3.06 MB | 2 年前3
《Efficient Deep Learning Book》[EDL] Chapter 6 - Advanced Learning Techniques - Technical Review0 码力 | 31 页 | 4.03 MB | 2 年前3
共 789 条
- 1
- 2
- 3
- 4
- 5
- 6
- 79
相关搜索词













