深度学习与PyTorch入门实战 - 43. nn.Module0 码力 | 16 页 | 1.14 MB | 2 年前3
【PyTorch深度学习-龙龙老师】-测试版202112 图 1.7 Mark 1 感知机网络结构 $ ^{②} $ 1969 年,美国科学家 Marvin Minsky 等人在出版的《Perceptrons》一书中指出了感知机等线性模型的主要缺陷,即无法处理简单的异或 XOR 等线性不 等并行加速芯片训练模型参数。如围棋程序 AlphaGo Zero 在 64 块 GPU 上从零开始训练了 40 天才得以超越所有的 AlphaGo 历史版本;自动网络结构搜索算法使用了 800 块 GPU 同时训练才能优化出较好的网络结构。 目前普通消费者能够使用的深度学习加速硬件设备主要来自 NVIDIA 的 GPU 显卡,图 1.12 例举了从 2008 年到 2017 年 NVIDIA GPU 定程度的通用智能。图 1.14 是 DQN 算法的网络结构,它并不是针对于某个游戏而设计的,而是可以控制 Atria 游戏平台上的 49 个游戏。  图 1.14 DON 算法网络结构示意图 $ ^{[1]} $ ### 1.4 深度学习应用0 码力 | 439 页 | 29.91 MB | 2 年前3
机器学习课程-温州大学-08深度学习-深度卷积神经网络1.jpg) ### 3. 其它现代网络 ## DenseNet DenseNet是2017年CVPR会议上提出的一种卷积神经网络结构,其名字来源于“密集连接网络(Densely Connected Network)”。 DenseNet的创新点在于在网络结构中引入了密集连接,使特征复用和梯度传播更加容易,在处理图像分类、目标检测、分割等问题中都取得了不错的结果。 和模型融合。 其主要贡献在于开创性地提出了通过均匀缩放(Accurate0 码力 | 32 页 | 2.42 MB | 2 年前3
大学霸 Kali Linux 安全渗透教程枚举服务 4.2 测试网络范围 4.3 识别活跃的主机 4.4 查看打开的端口 4.5 系统指纹识别 4.6 服务的指纹识别 4.7 其他信息收集手段 4.8 使用Maltego收集信息 4.9 绘制网络结构图 第5章 漏洞扫描 5.1 使用Nessus 5.2 使用OpenVAS 第6章 漏洞利用 6.1 Metasploitable操作系统 6.2 Metasploit基础 6.3 控制Meterpreter disclaimer复选框勾上,然后单击Close按钮就可以 了。 大学霸 Kali Linux 安全渗透教程 160 4.8 使用Maltego收集信息 4.9 绘制网络结构图 CaseFile工具用来绘制网络结构图。使用该工具能快速添加和连接,并能以图形界 面形式灵活的构建网络结构图。本节将介绍Maltego CaseFile的使用。 在使用CaseFile工具之前,需要修改系统使用的Java和Javac版本。因为CaseFile 161 4.9 绘制网络结构图 从输出的信息中可以看到已经修改为JDK7版本,而且是手动模式。这时,再使用 javac命令查看当前的版本信息,执行命令如下所示: root@kali:~# javac -version java version "1.7.0_25" 从以上结果中可以确定当前系统的javac命令版本是1.7.0。 【实例4-7】使用CaseFile工具绘制一个网络结构图。具体操作步骤如下所示。0 码力 | 444 页 | 25.79 MB | 2 年前3
QCon北京2018-《深度学习在微博信息流排序的应用》-刘博线性CTR模型 - 优势:简单高效、可解释性强 • 局限性:特征工程繁琐、无法表达高维抽象特征 ## 深度学习模型(DNN based model) - 优势: 表达能力强 泛化能力强 网络结构灵活  ## 深度学习应用实践 —— 0241bd830a2c27866da02b085a6156/p17_1.jpg) ## ➢ 网络复杂度 - 网络复杂度过高易导致过拟合 - 网络深度达到一定数值AUC反而小幅降低 |网络结构|logloss|wAUC| |---|---|---| |\[1024,512,256]|0.049|0.743| |\[512,256,128]|0.043|0.753| |\[256,128 业务和数据决定模型算法的应用场景 - 模型算法殊途同归 - 计算力和算法架构是保障 ## 总结展望 ## 未来工作 - 多模态—更好的对非结构化内容进行表征 - 用户行为序列embedding - 更多的融合网络结构适用于CTR预估场景  关注QCon微信公众号,获得更多干货!0 码力 | 21 页 | 2.14 MB | 2 年前3
全连接神经网络实战. pytorch 版## 目录 0.1 本书前言 5 1 准备章节 6 1.1 导入 pytorch 6 1.2 导入样本数据 7 2 构建神经网络 11 2.1 基本网络结构 11 2.2 使用 cuda 来训练网络 13 3 更完善的神经网络 15 3.1 模型的加载与保存 15 3.2 初始化网络权重-方法一 16 自己去操作,因此并不需要设置 target_transform。 前两节的源码参见 chapter1.py。 ### 2. 构建神经网络 本章描述如何构建神经网络模型。 ### 2.1 基本网络结构 我们定义神经网络的结构。在 pytorch 中要想使用神经网络,需要继承 nn.Module: class NeuralNetwork(nn.Module): def __init__(self): 数据要生成为 Variable 形式才能用于训练。 $ x\_data, y\_data $ 表示训练集的数据和标签; $ x\_data2, y\_data2 $ 表示测试集的数据和标签。 网络结构相对来说比较简单,由于并不是图像数据,所以设置的网络神经元数量大大减少: import torch.nn as nn class NeuralNetwork(nn.Module): def0 码力 | 29 页 | 1.40 MB | 2 年前3
2020美团技术年货 算法篇e a d_{h}\right)\mathbf{W}^{H} $$ Point-wise Feed-Forward Networks 该模块是为了提高模型的非线性能力提出来的,它就是全连接神经网络结构,计算公式如下: $$ \mathbf{S}^{\prime}=LayerNorm(\mathbf{E}+Dropout(MH(\mathbf{E}))) $$ $$ \mathbf{F 的字面命中、覆盖程度、BM25 等特征,虽然语义相关性具有较好的作用,但字面相关性仍然是一个不可或缺的模块,它起到信息补充的作用。 共享层:底层网络参数是所有场景网络共享。 场景层:根据业务场景进行划分,每个业务场景单独设计网络结构,打分时只经过所在场景的那一路。 损失函数:搜索业务更关心排在页面头部结果的好坏,将更相关的结果排到头部,用户会获得更好的体验,因此选用优化 NDCG 的 Lambda Loss $ ^{[34]} 联合训练模型目前还在实验当中,离线实验已经取得了不错的效果,在验证集上AUC提升了234BP。目前,场景切分依赖Query意图模块进行硬切分,后续自动场景切分也值得进行探索。 ## 应用实践 由于 BERT 的深层网络结构和庞大参数量,如果要部署上线,实时性上面临很大挑战。在美团搜索场景下,我们对基于 MT-BERT Fine-tuning 好的相关性模型(12 层)进行了 50QPS 压测实验,在线服务的 TP990 码力 | 317 页 | 16.57 MB | 2 年前3
2022年美团技术年货 合辑架在速度和精度方面仍有很大的提升的空间。基于此,我们通过研究并借鉴了业界已有的先进技术,开发了一套新的目标检测框架——YOLOv6。该框架支持模型训练、推理及多平台部署等全链条的工业应用需求,并在网络结构、训练策略等算法层面进行了多项改进和优化,在 COCO 数据集上,YOLOv6 在精度和速度方面均超越其他同体量算法,相关结果如下图 1 所示: ,最多只能在千亿级模型上处理约5万汉字的长度。 但在Kimi 智能助手上,Moonshot团队通过创新的网络结构、改进算法策略等等,对模型训练的各个环节进行了上百项的优化,从而在千亿级参数下可以实现对超长文本的全文理解。 简单而言,Moonshot AI并不通过当前滑动窗口、降采样、小模型等对效果损害较大的0 码力 | 74 页 | 1.64 MB | 2 年前3
共 63 条
- 1
- 2
- 3
- 4
- 5
- 6
- 7













