网络结构 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

深度学习与PyTorch入门实战 - 43. nn.Module

0 码力 | 16 页 | 1.14 MB | 2 年前
3
【PyTorch深度学习-龙龙老师】-测试版202112

![Image](/uploads/documents/a/7/7/d/a77d1afa688ff8d5eef8fcc2b1d8a235/p14_2.jpg) 图 1.7 Mark 1 感知机网络结构 $ ^{②} $ 1969 年，美国科学家 Marvin Minsky 等人在出版的《Perceptrons》一书中指出了感知机等线性模型的主要缺陷，即无法处理简单的异或 XOR 等线性不等并行加速芯片训练模型参数。如围棋程序 AlphaGo Zero 在 64 块 GPU 上从零开始训练了 40 天才得以超越所有的 AlphaGo 历史版本；自动网络结构搜索算法使用了 800 块 GPU 同时训练才能优化出较好的网络结构。目前普通消费者能够使用的深度学习加速硬件设备主要来自 NVIDIA 的 GPU 显卡，图 1.12 例举了从 2008 年到 2017 年 NVIDIA GPU 定程度的通用智能。图 1.14 是 DQN 算法的网络结构，它并不是针对于某个游戏而设计的，而是可以控制 Atria 游戏平台上的 49 个游戏。 ![Image](/uploads/documents/a/7/7/d/a77d1afa688ff8d5eef8fcc2b1d8a235/p19_1.jpg) 图 1.14 DON 算法网络结构示意图 $ ^{[1]} $ ### 1.4 深度学习应用

0 码力 | 439 页 | 29.91 MB | 2 年前
3
机器学习课程-温州大学-08深度学习-深度卷积神经网络

1.jpg) ### 3. 其它现代网络 ## DenseNet DenseNet是2017年CVPR会议上提出的一种卷积神经网络结构，其名字来源于“密集连接网络（Densely Connected Network）”。 DenseNet的创新点在于在网络结构中引入了密集连接，使特征复用和梯度传播更加容易，在处理图像分类、目标检测、分割等问题中都取得了不错的结果。 ![Image](/u takes all preceding feature-maps as input. ### 3. 其它现代网络 ## DenseNet 总的来说，DenseNet和ResNet都是很优秀的卷积神经网络结构，但DenseNet通过建立密集连接，使每一层都直接接收到多个之前层的特征图输出，增强了特征的流动和复用，从而在模型性能和训练稳定性上表现更好。 ![Image](/uploads/docume 3. 其它现代网络 ## EfficientNet EfficientNet是一种基于自动模型缩放的神经网络结构，由谷歌团队于2019年提出，该模型在图像分类、目标检测和图像分割等任务中取得了不错的结果。 EfficientNet的设计思路来源于模型优化的两个主要思想：神经网络结构搜索（Neural Architecture Search，NAS）和模型融合。其主要贡献在于开创性地提出了通过均匀缩放（Accurate

0 码力 | 32 页 | 2.42 MB | 2 年前
3
大学霸 Kali Linux 安全渗透教程

枚举服务 4.2 测试网络范围 4.3 识别活跃的主机 4.4 查看打开的端口 4.5 系统指纹识别 4.6 服务的指纹识别 4.7 其他信息收集手段 4.8 使用Maltego收集信息 4.9 绘制网络结构图第5章漏洞扫描 5.1 使用Nessus 5.2 使用OpenVAS 第6章漏洞利用 6.1 Metasploitable操作系统 6.2 Metasploit基础 6.3 控制Meterpreter disclaimer复选框勾上，然后单击Close按钮就可以了。大学霸 Kali Linux 安全渗透教程 160 4.8 使用Maltego收集信息 4.9 绘制网络结构图 CaseFile工具用来绘制网络结构图。使用该工具能快速添加和连接，并能以图形界面形式灵活的构建网络结构图。本节将介绍Maltego CaseFile的使用。在使用CaseFile工具之前，需要修改系统使用的Java和Javac版本。因为CaseFile 161 4.9 绘制网络结构图从输出的信息中可以看到已经修改为JDK7版本，而且是手动模式。这时，再使用 javac命令查看当前的版本信息，执行命令如下所示： root@kali:~# javac -version java version "1.7.0_25" 从以上结果中可以确定当前系统的javac命令版本是1.7.0。【实例4-7】使用CaseFile工具绘制一个网络结构图。具体操作步骤如下所示。

0 码力 | 444 页 | 25.79 MB | 2 年前
3
QCon北京2018-《深度学习在微博信息流排序的应用》-刘博

线性CTR模型 - 优势：简单高效、可解释性强 • 局限性：特征工程繁琐、无法表达高维抽象特征 ## 深度学习模型（DNN based model） - 优势：表达能力强泛化能力强网络结构灵活 ![Image](/uploads/documents/5/1/0/2/510241bd830a2c27866da02b085a6156/p14_1.jpg) ## 深度学习应用实践 —— 0241bd830a2c27866da02b085a6156/p17_1.jpg) ## ➢ 网络复杂度 - 网络复杂度过高易导致过拟合 - 网络深度达到一定数值AUC反而小幅降低 |网络结构|logloss|wAUC| |---|---|---| |\[1024,512,256]|0.049|0.743| |\[512,256,128]|0.043|0.753| |\[256,128 业务和数据决定模型算法的应用场景 - 模型算法殊途同归 - 计算力和算法架构是保障 ## 总结展望 ## 未来工作 - 多模态—更好的对非结构化内容进行表征 - 用户行为序列embedding - 更多的融合网络结构适用于CTR预估场景 ![Image](/uploads/documents/5/1/0/2/510241bd830a2c27866da02b085a6156/p21_1.jpg) 关注QCon微信公众号，获得更多干货！

0 码力 | 21 页 | 2.14 MB | 2 年前
3
全连接神经网络实战. pytorch 版

## 目录 0.1 本书前言 5 1 准备章节 6 1.1 导入 pytorch 6 1.2 导入样本数据 7 2 构建神经网络 11 2.1 基本网络结构 11 2.2 使用 cuda 来训练网络 13 3 更完善的神经网络 15 3.1 模型的加载与保存 15 3.2 初始化网络权重-方法一 16 自己去操作，因此并不需要设置 target_transform。前两节的源码参见 chapter1.py。 ### 2. 构建神经网络本章描述如何构建神经网络模型。 ### 2.1 基本网络结构我们定义神经网络的结构。在 pytorch 中要想使用神经网络，需要继承 nn.Module: class NeuralNetwork(nn.Module): def __init__(self): 数据要生成为 Variable 形式才能用于训练。 $ x\_data, y\_data $ 表示训练集的数据和标签； $ x\_data2, y\_data2 $ 表示测试集的数据和标签。网络结构相对来说比较简单，由于并不是图像数据，所以设置的网络神经元数量大大减少： import torch.nn as nn class NeuralNetwork(nn.Module): def

0 码力 | 29 页 | 1.40 MB | 2 年前
3
2020美团技术年货算法篇

e a d_{h}\right)\mathbf{W}^{H} $$ Point-wise Feed-Forward Networks 该模块是为了提高模型的非线性能力提出来的，它就是全连接神经网络结构，计算公式如下： $$ \mathbf{S}^{\prime}=LayerNorm(\mathbf{E}+Dropout(MH(\mathbf{E}))) $$ $$ \mathbf{F 的字面命中、覆盖程度、BM25 等特征，虽然语义相关性具有较好的作用，但字面相关性仍然是一个不可或缺的模块，它起到信息补充的作用。共享层：底层网络参数是所有场景网络共享。场景层：根据业务场景进行划分，每个业务场景单独设计网络结构，打分时只经过所在场景的那一路。损失函数：搜索业务更关心排在页面头部结果的好坏，将更相关的结果排到头部，用户会获得更好的体验，因此选用优化 NDCG 的 Lambda Loss $ ^{[34]} 联合训练模型目前还在实验当中，离线实验已经取得了不错的效果，在验证集上AUC提升了234BP。目前，场景切分依赖Query意图模块进行硬切分，后续自动场景切分也值得进行探索。 ## 应用实践由于 BERT 的深层网络结构和庞大参数量，如果要部署上线，实时性上面临很大挑战。在美团搜索场景下，我们对基于 MT-BERT Fine-tuning 好的相关性模型（12 层）进行了 50QPS 压测实验，在线服务的 TP99

0 码力 | 317 页 | 16.57 MB | 2 年前
3
2022年美团技术年货合辑

架在速度和精度方面仍有很大的提升的空间。基于此，我们通过研究并借鉴了业界已有的先进技术，开发了一套新的目标检测框架——YOLOv6。该框架支持模型训练、推理及多平台部署等全链条的工业应用需求，并在网络结构、训练策略等算法层面进行了多项改进和优化，在 COCO 数据集上，YOLOv6 在精度和速度方面均超越其他同体量算法，相关结果如下图 1 所示： ![Image](/uploads/documen 进行了重新设计和优化。该思想基于硬件的特性、推理框架 / 编译框架的特点，以硬件和编译友好的结构作为设计原则，在网络构建时，综合考虑硬件计算能力、内存带宽、编译优化特性、网络表征能力等，进而获得又快又好的网络结构。对上述重新设计的两个检测部件，我们在 YOLOv6 中分别称为 EfficientRep Backbone 和 Rep-PAN Neck，其主要贡献点在于： • 引入了 RepVGG $ ^{[4]} Intel MKL 编译框架的帮助。实验表明，通过上述策略，YOLOv6 减少了在硬件上的延时，并显著提升了算法的精度，让检测网络更快更强。以 nano 尺寸模型为例，对比 YOLOv5-nano 采用的网络结构，本方法在速度上提升了 21%，同时精度提升 3.6% AP。 ![Image](/uploads/documents/5/b/1/9/5b19ae814e1fdbee8febba2ae4abed19/p11_1

0 码力 | 1356 页 | 45.90 MB | 2 年前
3
PyConChina2022-上海-基于Python的深度学习框架设计与实现-刘凡平

能公司布局应用层。 ## 一、背景：深度学习框架的演进 ## 深度学习框架的演进 ## 萌芽阶段时间范围：2000年-2012年左右 ## 使用特点 1、API复杂； 2、手写神经网络结构； 3、无GPU算力；应用情况：受限于算力不足，神经网络技术影响力相对有限，更多以机器学习工具的形式产生。示例框架：OpenNN、Torch ## 深化阶段时间范围：2020年-至今 2、多维度分析模型性能 ## 三、设计：最小MVP深度学习框架的层次逻辑 ## 评估 Accuracy ## 数据加载 Precision Recall F1 Score ROC ## 网络结构 ## 激活函数 Sigmoid Tanh ReLU Maxout ELU ..... Add Sub Exp Log Datasets ABCDataset ## 目标函数

0 码力 | 15 页 | 2.40 MB | 2 年前
3
Moonshot AI 介绍

本性能逼近全监督学习的高效对齐方法。 ii. 视觉方面。团队成员发明了MoCo，引爆了基于对比学习的视觉预训练范式，也是过去三年CVPR引用量最高的工作；发明了ShuffleNet，最高效的视觉网络结构之一；主导开发了detectron2，一个被广泛使用的视觉开源项目并被集成到Meta全线VR/AR产品中。 iii. 强化学习方面。团队成员作为一作提出了基于关系学习的少样本方法，得到斯坦福大学、前是完全做不了的任务，那现在可以做了。还有另外一个很重要的变量，就是Transformer架构的发明。如果回到六年前，这个世界上可能还没有Transformer架构，以前的学者研究过传统RNN网络结构的极限，有个论文标题就叫《ExpLoring the Limits of Language Modeling》，但是你会发现最终的结果就是一无所获。因为当模型变大之后，你并不能得到一个更好的模型，而在推理方面，即使是将单机显存配置拉到目前的最高水平（如配备8张80GB显存的GPU芯片），最多只能在千亿级模型上处理约5万汉字的长度。但在Kimi 智能助手上，Moonshot团队通过创新的网络结构、改进算法策略等等，对模型训练的各个环节进行了上百项的优化，从而在千亿级参数下可以实现对超长文本的全文理解。简单而言，Moonshot AI并不通过当前滑动窗口、降采样、小模型等对效果损害较大的

0 码力 | 74 页 | 1.64 MB | 2 年前
3

共 56 条前往

页

分类

语言

格式

深度学习与PyTorch入门实战 - 43. nn.Module

【PyTorch深度学习-龙龙老师】-测试版202112

机器学习课程-温州大学-08深度学习-深度卷积神经网络

大学霸 Kali Linux 安全渗透教程

QCon北京2018-《深度学习在微博信息流排序的应用》-刘博

全连接神经网络实战. pytorch 版

2020美团技术年货算法篇

2022年美团技术年货合辑

PyConChina2022-上海-基于Python的深度学习框架设计与实现-刘凡平

Moonshot AI 介绍

搜索

分类

语言

格式