分布式计算 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

构建基于富媒体大数据的弹性深度学习计算平台

构建基于富媒体大数据的弹性深度学习计算平台 SPEAKER / 土土@七牛 AtLab Mobile —> 富媒体时代数据存储数据加速数据处理直播点播 Connect 每天超过10亿图像上传超过万亿小时的音视频存储 What are they？内容审核团队运营分析团队 AI？ Content 分类检测分割跟踪描述搜索分析 …

0 码力 | 21 页 | 1.71 MB | 1 年前
3
微博在线机器学习和深度学习实践-黄波

• 一键部署 • 基于K8S的deployment模式，一键端口分配与模型服务部署 • 基于ZK的服务发现，一键进行流量灰度与发布 • 性能优化 • 通信优化：特征请求与模型计算单元化，在线样本格式压缩 • 计算优化：基于SSE／AVX 指令优化 3 在线机器学习-模型服务部署 • 模型更新频次效果对比 • FM：数据越新，效果越好 • 相同数据规模，时间越新，效果越好，且时间差距越大，差异越明显 • PS&MPI：DistributionStrategy API，统一分布式语义，解耦分布式架构与模型训练框架 • 使用FP16通信，使用FP32做计算，带宽压力降低一倍 • IO优化 • 多线程样本并发读取，样本读取与计算PIPELINE，实现计算与IO的overlap 4 深度学习-深度学习模型训练 • 分布式模型推理框架：WeiServing 异构CPU集群 kubernetes/ol-submit 算法模型层 4 深度学习-分布式模型推理 • 推理性能优化 • 减少计算量： operator fusion/XLA/TVM/prune/float16/quantization • 加快计算速度： batching/TensorRT/MPS/SSE/AVX/Neon • operator fusion • 针对特定场景重写耗时算子 • 重构tensorflow计算引擎 • batching

0 码力 | 36 页 | 16.69 MB | 1 年前
3
超大规模深度学习在美团的应用-余建平

超大规模深度学习在美团的应用余建平美团点评用户平台研究员自我介绍自我介绍 2011年硕士毕业于南京大学计算机科学与技术系。毕业后曾在百度凤巢从事机器学习工程相关的工作，加入美团后，负责超大规模机器学习系统，从无到有搭建起支持千亿级别规模的深度学习系统，与推荐、搜索、广告业务深度合作，在算法上提供从召回到排序的全系统优化方案，在工程上提供离线、近线、在线的全流程解决方案。更快数据反馈、更少资源消耗  分钟级的数据反馈  增量训练、避免batch重训带来的资源消耗关于Online Learning MLX的模型能力 • 支持千亿级特征、千亿级样本 • 支持计算图模式，模型结构灵活多样  支持推荐、搜索、广告场景常用的深度学习模型  FTRL、FM、FFM、WDL、DCN、DeepFM、MTL等 • Optimizer  FTRL、AdaGr • Loss Function  LogLoss、SquareLoss、Cross Entropy、etc • 评估指标  AUC、Loss、MAE、RMSE  支持外部eval工具，计算MAP、NDCG MLX的模型能力 • 提供离线、近线、在线全流程解决方案，各阶段提供扩展方案，降低算法迭代成本； • 支持Online Learning，提供从近线到在线的模型数据通路； •

0 码力 | 41 页 | 5.96 MB | 1 年前
3
阿里云上深度学习建模实践-程孟力

阿里云深度学习实践程孟力花名: 杨熙阿里巴巴-计算平台-PAI 个性化推荐视频理解智能对话系统图像检索更多场景  OCR识别  人脸核身  智能风控  自动驾驶  语音助手 • • • 优势: 效果显著超越传统模型(线性层模型 / 树模型 / SVM模型 / … ) 深度学习应用场景沙漠湖泊旅行深度学习应用主要的挑战： 2.模型效果优化困难加了10倍怎么优化？ 2.模型效果优化困难 1.方案复杂 Data Model Compute Platform 要求:  准确: 低噪声  全面: 同分布模型选型:  容量大  计算量小训练推理:  高qps, 低rt  支持超大模型  性价比流程长、环节多:  推荐场景: 召回 + 粗排 + 精排 + 多样性/冷启动  实人认证: 卡证识别 + 人脸检测图像视频算法库 Bert TextInput Optim izer 性能优越:  分布式存储  分布式查询功能完备:  GSL/负采样  主流图算法  异构图 (user/item/attribute)  动态图标准化: Standard Libraries Graph-Learn: 分布式图算法库标准化: Standard Solutions Continuous Optimization:

0 码力 | 40 页 | 8.51 MB | 1 年前
3
从推荐模型的基础特点看大规模推荐类深度学习系统的设计袁镱

项⽬于17年启动，先后经过了6个主要版本的迭代 � 覆盖腾讯PCG全部业务的推荐场景，⽀持腾讯 IEG，CSIG，QQ⾳乐，阅⽂等业务的部分推荐场景 � 袁镱博⼠，专家⼯程师 � 研究⽅向：机器学习系统，云计算，⼤数据系统 � 负责腾讯平台与内容事业群（PCG）技术中台核⼼引擎：⽆量系统。⽀持⼤规模稀疏模型训练，上线与推理提纲 �推荐场景深度学习系统的基本问题与特点 �推荐类模型的深度学习系统设计 Embedding以稀疏的⽅式表达信息⼤规模推荐模型深度学习系统基本解决维度分布式系统⼤规模模型优化算法 1. ⾼性能 2. 效果⽆损的优化 � Feature 1（基本特点） � Feature 2（数据的时空特点） � Feature3（机器学习的特点）⼤规模推荐模型深度学习系统基本解决维度分布式系统⼤规模模型优化算法 1. ⾼性能 2. 效果⽆损的优化 � Feature 1（基本特点） � Feature 2（数据的时空特点） � Feature3（机器学习的特点）训练框架—基于参数服务器架构的分布式训练框架 TB级模型分⽚存储/更新百TB数据分⽚训练 Feature 1: 动态空间 Feature 2.1:短时间内只有部分item和user 被命中，只有部分参数被⽤到参数按需

0 码力 | 22 页 | 6.76 MB | 1 年前
3
TensorFlow on Yarn：深度学习遇上大数据

“ps1.example.com:2222” ]}) 分布式版本ClusterSpec定义：� 带来的问题：� • ⼿动指定机器很繁琐� • 端⼝冲突� • 机器负载不均� TensorFlow使用现状及痛点 • ⼿动分发训练样本� • ⼿动拉取训练模型� TensorFlow使用现状及痛点 • 多⼈多服务器使用混乱，计算资源如何划分？� • 没有GPUs集群资源管理和调度（内存、CPU、GPU、作业的统⼀管理、状态跟踪� • 资源组（Schedule Pool）的划分� • 作业进程的资源隔离� Yarn能解决什么问题：� TensorFlow on Yarn设计 • 同时支持单机和分布式TensorFlow程序� • 支持GPU资源管理和调度� • 不再需要⼿动配置CluserSpec信息，仅需要设置work 和ps的数量� • 训练数据和训练模型基于HDFS统⼀存储� • --board-enable true \ #是否开启Tensorboard服务� --conf tf.file.download.thread.nums=10 #其他参数设置� 提交脚本示例（分布式版本）：� TensorFlow on Yarn设计 Yarn首页作业信息：� 作业类型集群GPU资源概况作业分配到的GPU数量 TensorFlow on Yarn设计

0 码力 | 32 页 | 4.06 MB | 1 年前
3
PyTorch OpenVINO 开发实战系列教程第一篇

是开放源代码的机器学习框架，目的是加速从研究原型到产品开发的过程。其 SDK 主要基于 Python 语言，而 Python 语言作为流行的人工智能开发语言一直很受研究者与开发者的欢迎。其模型训练支持CPU与GPU、支持分布式训练、云部署、针对深度学习特定领域有不同的丰富的扩展库。 1.1.1 Pytorch 历史 Pytorch 在 2016 年由 facebook 发布的开源机器学习（深度学习）框架，Pytorch 语言作为框架的首选编程语言，所以它的名字是在 torch 的前面加上 Py 之后的 Pytorch。由于 Pytorch 吸取了之前一些深度学习框架优点，开发难度大大降低、很容易构建各种深度学习模型并实现分布式的训练，因此一发布就引发学术界的追捧热潮，成为深度学习研究者与爱好者的首选开发工具。在 pytorch 发布之后两年的 2018 年 facebook 又把 caffe2 项目整合到 pytorch 智能开发者的认可与追捧，也成为工业界最受欢迎的深度学习框架之一。 Pytorch 发展至今，其版本跟功能几经迭代，针对不同的场景任务分裂出不同的分支扩展库，比如针对自然语言处理（NLP）的 torchtext、针对计算机视觉的 torchvision、针对语音处理的 torchaudio，这些库支持快速模型训练与演示应用，可以帮助开发者快速搭建原型演示。此外在移动端支持、模型部署的压缩、量化、服务器端云化部署、推理端

0 码力 | 13 页 | 5.99 MB | 1 年前
3
谭国富：深度学习在图像审核的应用

烟雾，吸烟识别 Ø 基于视频直播监管需求，提供吸烟，烟雾，涉嫌吸毒等场景的识别能力 SACC2017 深度学习介绍深度网络训练选择加快训练 - 分布式训练系统图像海量数据的积累 02 深度学习技术介绍加快计算 - 深度学习算法加速 RPN SACC2017 技术发展应用突破 1956 达特茅斯会议标志AI 诞生 1957 神经网络 Perceptr 森布拉特发明 1980 2006 Hinton提出 “深度学习” 的神经网络 2013 深度学习算法在语音和视觉识别上有重大突破，识别率超过99% 和95% 1970 受限于计算能力，进入第一个寒冬 XCON专家系统出现，每年节约4000 万美元第1阶段：人工智能起步期（1956-1980s）第2阶段：专家系统推广 (1980s-1990s) 第3阶段：深度学习 2012 Google的无人驾驶汽车上路（2009年宣布） 2016 Deepmind团队 AlphaGo&Ma ster运用深度学习算法战胜围棋冠军 1990-1991 人工智能计算机DARPA没能实现，政府投入缩减，进入第二次低谷深度学习 - 带动的AI浪潮 2016 2016 深度学习全面爆发 2016 - 讯飞，搜狗，阿里演示了实时语音识别翻译

0 码力 | 32 页 | 5.17 MB | 1 年前
3
动手学深度学习 v2.0

. . . . . . . . . . . . . . . . 71 2.5.3 分离计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 2.5.4 Python控制流的梯度计算 . . . . . . . . . . . . . . . . . . . . . . . 前向传播、反向传播和计算图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 4.7.1 前向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 4.7.2 前向传播计算图 . . . 10.8 提交Kaggle预测 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 5 深度学习计算 191 5.1 层和块 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

0 码力 | 797 页 | 29.45 MB | 1 年前
3
机器学习课程-温州大学-08机器学习-集成学习

回归树问题的提升算法：输入：训练数据集? = ?1, ?1 , ?2, ?2 , … , ??, ?? 输出：提升树??(?) 1 初始化?0 ? = 0 2 对? = 1,2, … ? (?)计算残差 ??? = ?? − ??−1 ?? , ? = 1,2, … , ? ? 拟合残差???学习一个回归树，得到?(?: ??) ? 更新??(?) = ??−1 ? + ? ?: ?? 3 =1 ? ?(??, ?) 2 对? = 1,2, … ? ? 对? = 1,2 … ?计算 ??? = − ??(??, ?(??)) ??(??) ? ? =??−1(?) ? 拟合???学习一个回归树，得到? ?: ?? ? 更新?? ? = ??−1 ? + ??? ?: ?? ? 计算步长, ?? = ??? min ? ෍ ?=1 L(??, ??−1 ?? + ?? ?? ）最大的分裂方式贪心方法，众多????中找到最大值做为最优分割节点（split point），因此模型会将所有样本按照（一阶梯度）从小到大排序，通过遍历，查看每个节点是否需要分割，计算复杂度是：决策树叶子节点数 – 1。 XGBoost的分裂方式 35 4.LightGBM 01 集成学习方法概述 02 Adaboost和GBDT算法 03 XGBoost

0 码力 | 50 页 | 2.03 MB | 1 年前
3

共 66 条前往

页

分类

语言

格式