动手学深度学习 v2.0
前的工具所不能的方式处理低级的感知数据。毋庸置疑,深度学习方法中最显著的共同点是使用端到端训练。 也就是说,与其基于单独调整的组件组装系统,不如构建系统,然后联合调整它们的性能。例如,在计算机视 觉中,科学家们习惯于将特征工程的过程与建立机器学习模型的过程分开。Canny边缘检测器 (Canny, 1987) 和SIFT特征提取器 (Lowe, 2004) 作为将图像映射到特征向量的算法,在过去的十年里占据了至高无上的地 通常用粗体、大写字母来表 示(例如,X、Y和Z),在代码中表示为具有两个轴的张量。 数学表示法使用A ∈ Rm×n 来表示矩阵A,其由m行和n列的实值标量组成。我们可以将任意矩阵A ∈ Rm×n视 为一个表格,其中每个元素aij属于第i行第j列: A = � ������ a11 a12 · · · a1n a21 a22 · · · a2n ... ... ... ... am1 01的正态分布中随机采 样,偏置参数将初始化为零。 正如我们在构造nn.Linear时指定输入和输出尺寸一样,现在我们能直接访问参数以设定它们的初始值。我 们通过net[0]选择网络中的第一个图层,然后使用weight.data和bias.data方法访问参数。我们还可以使用 替换方法normal_和fill_来重写参数值。 net[0].weight.data.normal_(0, 00 码力 | 797 页 | 29.45 MB | 1 年前3Keras: 基于 Python 的深度学习库
要在不同的输入上共享同一个层,只需实例化该层一次,然后根据需要传入你想要的输入 即可: # 这一层可以输入一个矩阵,并返回一个 64 维的向量 shared_lstm = LSTM(64) # 当我们重用相同的图层实例多次,图层的权重也会被重用 (它其实就是同一层) encoded_a = shared_lstm(tweet_a) encoded_b = shared_lstm(tweet_b) # 然后再连接两个向量: 让我们暂停一会,看看如何读取共享层的输出或输出尺寸。 3.2.6 层「节点」的概念 每当你在某个输入上调用一个层时,都将创建一个新的张量(层的输出),并且为该层添加 一个「节点」,将输入张量连接到输出张量。当多次调用同一个图层时,该图层将拥有多个节点 索引 (0, 1, 2…)。 在之前版本的 Keras 中,可以通过 layer.get_output() 来获得层实例的输出张量,或者通 过 layer.output_shape set_weights(weights): 从含有 Numpy 矩阵的列表中设置层的权重(与 get_weights 的输出形状相同)。 • layer.get_config(): 返回包含层配置的字典。此图层可以通过以下方式重置: layer = Dense(32) config = layer.get_config() reconstructed_layer = Dense.from_config(config)0 码力 | 257 页 | 1.19 MB | 1 年前3超大规模深度学习在美团的应用-余建平
DNN模型解决耗时是关键,利用预计算解决耗时问题 效果保障:保证用户的个性化信息,降低候选集计算复杂度 粗排模型 • 精排阶段的特点 候选集较少,通常在百级别 线上耗时相对宽松,几十毫秒(视效果而定) • 精排模型的特点 结构复杂,怎么有效果怎么来 特征多样:历史行为、统计值、id类特征、高维交叉, etc. • 模型发展历程 树模型:Random Forest、XGBoost0 码力 | 41 页 | 5.96 MB | 1 年前3复杂环境下的视觉同时定位与地图构建
R开发套件 SLAM应用介绍 • 混合现实:微软HoloLens HoloLens融合了场景位置感知和头盔显示技术,并提供了完整的软硬件解决方案。 Hololens部分传感器 左右双目+前视RGB摄像头+深度传感器 Hololens宣传视频 视觉SLAM • 主要传感器 • 单目摄像头 • 双目摄像头 • 多目摄像头 • 其它辅助传感器 • 廉价IMU、GPS • 深度传感器0 码力 | 60 页 | 4.61 MB | 1 年前3谭国富:深度学习在图像审核的应用
Ø 随着互联网的飞速发展和信息量的猛增, 大量的色情图片、暴力等不良信息夹杂其 中,严重影响着互联网的健康发展。 Ø 直播行业的快速兴起,使得视频中不良信 息含量更加迅猛增长,色情暴力等不雅视 频频繁流出,导致各网络直播平台面临危 机。 Ø 内容监管日趋严格, 2017年上半年,各 大直播行业协会相应成立,行业平台自我 规范的同时,网信办、文化部等国家部门 对于直播行业监管也越发严格,几乎所有0 码力 | 32 页 | 5.17 MB | 1 年前3机器学习课程-温州大学-01机器学习-引言
5 大疆创新 图像识别技术、智能引擎技术等 无人机 中国 2006年 战略融资 估值210亿美元 6 商汤科技 计算机视觉技术、深度学习 安防 中国 2014年 D轮融资 估值70亿美元 7 旷视科技 计算机视觉技术等 安防 中国 2011年 D轮融资 估值40亿美元 8 科大讯飞 智能语音技术 综合 中国 1999年 上市 市值108亿美元 9 Automation Anywhere 自然语言处理技术、非结构化数据认知0 码力 | 78 页 | 3.69 MB | 1 年前3机器学习课程-温州大学-01深度学习-引言
5 大疆创新 图像识别技术、智能引擎技术等 无人机 中国 2006年 战略融资 估值210亿美元 6 商汤科技 计算机视觉技术、深度学习 安防 中国 2014年 D轮融资 估值70亿美元 7 旷视科技 计算机视觉技术等 安防 中国 2011年 D轮融资 估值40亿美元 8 科大讯飞 智能语音技术 综合 中国 1999年 上市 市值108亿美元 9 Automation Anywhere 自然语言处理技术、非结构化数据认知0 码力 | 80 页 | 5.38 MB | 1 年前3【PyTorch深度学习-龙龙老师】-测试版202112
而言,合理性都是可较好判断的。改变张量的存储顺序将在“交换维度”一节介绍。 在算法设计过程中,维度变换操作通常是连续反复进行的,为了保持合理的维度变 换,常用的技巧就是人为跟踪存储的维度顺序。例如根据“图片数量-行-列-通道”初始视 图保存的张量,存储也是按照“图片数量-行-列-通道”的顺序写入的。如果按着“图片数 量-像素-通道”的方式恢复视图,并没有与“图片数量-行-列-通道”相悖,因此能得到合 理的数据。但是如果按着“图片 h3 = h2@w3 + b3 h3 = F.relu(h3) # 输出层前向计算,[b, 64] => [b, 10] h4 = h3@w4 + b4 输出层是否需要添加激活函数通常视具体的任务而定,这里选择不添加激活函数,直接输 出。不同于 Numpy 实现的数值计算模式,PyTorch 张量在计算的过程中同时也在内部构建 了计算图,方便后续的梯度方向传播。如果只需要实现纯数值计算,可以将代码包裹在0 码力 | 439 页 | 29.91 MB | 1 年前3
共 8 条
- 1