实时同步 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

微博在线机器学习和深度学习实践-黄波

趋势 • 实时化：在线机器学习 • 深度化：深度学习 • 平台化：机器学习平台 2 推荐 • 实时化 • 特征实时化：更及时反馈用户行为，更细粒度刻画用户 • 模型实时化：根据线上样本实时训练模型，及时地反映对象的线上变化模型推理预测服务实时特征实时数据 3 在线机器学习实时样本实时模型训练实时更新参数 Task 训练预处理 Node 实时样本拼接 Node Node 在线模型训练 Node 离线样本拼接 Node 在线模型评估 Node 模型上线 Node 实时特征处理 Node 离线特征处理 Task Kafka输入 input process process output WeiFlow 工作流 Task 模型训练 Task 模型训练 Task Metrics输出 3 在线机器学习-工作流互动行为日志数据过滤样本拼接定时轮询 Kafka Hdfs 样本输出 3 在线机器学习-实时样本生成 • 多流拼接 • 曝光，互动，点击，真实阅读等多种数据流接入并多流拼接 • 如何解决日志延时问题 • 延迟等待机制，先到先走 • 定时轮寻，最长N分钟等待 • Kafka 堆积监控，实时报警 • 如何解决内存问题 • 调整内存参数 • 关闭多余的监控点 • 如何异常处理

0 码力 | 36 页 | 16.69 MB | 1 年前
3
从推荐模型的基础特点看大规模推荐类深度学习系统的设计袁镱

基于深度学习模型的推荐流程，场景与⽬标 Serving系统 HDFS 数据通道训练系统召回业务服务排序混排模型管理上线管理⽆量 RGW/Cos/ kafka 样本存储实时样本⽣成服务离线样本⽣成任务数据通道特征处理模型登记模型上线预测请求数据落地⽆量⽤户⾏为数据上报特征库内容获取请求 � 推荐场景的重要性新增：GPU并⾏操作友好->CSR格式的显存数据访问 SSD磁盘 10TB 全部参数内存 1TB 即将⽤到的参数显存 32/40/80GB 正在训练的参数分布式训练的慢机与同步问题 � Feature 2.1: 短时间内只有部分item和user被命中，只有部分参数被⽤到 � GPU训练的优势 � 更少的机器节点，更少的分布式系统相关问题 � 更⾼的性价⽐ 1 >15亿key/秒近千台只读版本写版本 CPU型服务 Feature 2.2 Hotkey缓存优化 <10台内存型服务并发查询优化数⼗台⽹络型服务 TB级模型实时上线 � 问题：TB模型实时多地传输和加载成本⾼ � ⽅案：⾼低频分别上线 � 更灵活的⽤法：模型多切⽚，按需上线 � Dssm � wdl ... 分布式Serving集群副本1 副本2 Group

0 码力 | 22 页 | 6.76 MB | 1 年前
3
阿里云上深度学习建模实践-程孟力

重排 MaxCompute Datahub 离线特征样本构造实时特征 Flink 训练数据推荐日志模型发布在线流程离线流程智能推荐解决方案 > PAI-REC 推荐引擎 PAI-REC 推荐引擎多路召回曝光/状态过滤粗排/精排策略[类目打散、流量控制、…] 实时采集后端日志 PAI-REC 配置中心 AB实验实验工具拉取配置冷启动召回冷启动排序 Pipeline1 Pipeline2 标准化: Standard Solutions 标准化: Standard Solutions 智能推荐解决方案 > 实时推荐方案 3.工程优化复杂 4.数据获取困难挑战深度模型是非线性的黑盒: • 参数很多 • 参数敏感 • 不同场景的数据上差异大从FM到DeepFM rt 增加了10倍怎么优化？ Hash Conflict] 特征准入/淘汰 Adaptive Embedding 训练: 推理: Ring All-reduc同步训练 [HybridBackend/SOK] 特征选择 [VariationalDropout] 通信优化 [GRPC++] 实时训练 [增量更新] 混合精度 [bf16] 工程优化: 千亿特征优化模型蒸馏 AVX/SSE优化 Graph优化 [User

0 码力 | 40 页 | 8.51 MB | 1 年前
3
【PyTorch深度学习-龙龙老师】-测试版202112

页面提交： https://github.com/dragen1860/Deep-Learning-with-PyTorch-book/issues ❑ 本书主页，以及源代码，电子书下载，正式版也会在此同步更新： https://github.com/dragen1860/Deep-Learning-with-PyTorch-book ❑ 姊妹书《TensorFlow 深度学习—深入理解人工智能算法设计》： array(points), lr) loss = mse(b, w, points) # 计算当前的均方差，用于监控训练进度 if step%50 == 0: # 打印误差和实时的 w,b 值 print(f"iteration:{step}, loss:{loss}, w:{w}, b:{b}") return [b, w] # 返回最后一次的 24 现在来考虑不合理的视图变换。例如，如果定义新视图为[?, , ℎ, ?]，[?, ?, ℎ ∗ ]或者 [?, ?, ℎ, ]等时，依据逻辑需要调整张量的存储顺序，如果不同步更新张量的存储顺序，那么恢复出的数据将与新视图的逻辑不一致，从而导致数据错乱。合理性通常需要用户正确理解数据，才能判断操作是否合理，因此具有一定主观性，但是对于大部分逻辑变换操作而言，合理性都

0 码力 | 439 页 | 29.91 MB | 1 年前
3
动手学深度学习 v2.0

简单网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 531 12.5.4 数据同步 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 531 12.5.5 数据分发 7.1 数据并行训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 540 12.7.2 环同步（Ring Synchronization） . . . . . . . . . . . . . . . . . . . . . . . . . . . . 542 12.7.3 多机训练 . . 应于模型的预测类别。每个单元格的值cij是验证集中，真实标签为j，而我们的模型预测为i的样本数量所占的比例。现在，我们不能直接计算目标数据上的混淆矩阵，因为我们无法看到真实环境下的样本的标签，除非我们再搭建一个复杂的实时标注流程。然而，我们所能做的是将所有模型在测试时的预测取平均数，得到平均模型输出µ(ˆy) ∈ Rk，其中第i个元素µ(ˆyi)是我们模型预测测试集中i的总预测分数。 176 4. 多层感知机

0 码力 | 797 页 | 29.45 MB | 1 年前
3
复杂环境下的视觉同时定位与地图构建

构建环境地图（稀疏或者稠密的三维点云）稀疏SLAM 稠密SLAM SLAM系统常用的框架输入 • 传感器数据前台线程 • 根据传感器数据进行跟踪求解，实时恢复每个时刻的位姿后台线程 • 进行局部或全局优化，减少误差累积 • 场景回路检测输出 • 设备实时位姿 • 三维点云 RGB图深度图 IMU测量值优化以减少误差累积回路检测 SLAM应用介绍 • 扫地机器人小米扫地机器人 ENFT-SFM：能够高效地处理大尺度场景下拍摄的循环回路和多视频序列。 • 单目视觉的同时定位与地图构建 • ENFT-SLAM：能在大尺度场景下实时稳定工作、在线回路闭合； • RDSLAM：能在动态场景下稳定工作； • RKSLAM：可以实时运行在移动设备上，并能处理快速运动和强旋转。 ENFT-SFM: Efficient Non- Consecutive Feature Tracking • 回路检测与闭合 • 对原来的非连续特征轨迹匹配进行修改 • 计算当前帧与历史关键帧的相似度，并选择相似度高的关键帧进行匹配 • 采用基于分段的集束调整进行优化 Garden序列上的实时SLAM Garden序列结果比较 ENFT-SLAM ORB-SLAM Non-consecutive Track Matching Segment-based BA Bag-of-words

0 码力 | 60 页 | 4.61 MB | 1 年前
3
经典算法与人工智能在外卖物流调度中的应用

佳分割点，满足海量数据的实时性要求 • 在供需失衡之前，即实施调控手段 5 供需平衡 14 5.2 单量调控模型 • 通过价格平衡未来的进单量和系统可承载的单量 • 基于GBRT对未来进入单量的实时预测 • 贪心算法求解系统最佳承载单量 • 根据当前系统状态匹配最佳的溢价手段使之回归至最大可承载单量的调控模型 • 在供需失衡之时，实施最有效的调控手段 5 总结—外卖订单智能调度要解决的核心问题 • 真实再现调度场景细节 • 回溯定位异常调度原因，诊断调试算法 • 实时获取调度监控指标 • 及时预警引入人工干预 • 精准模拟实际订单分布情况 • 有效评估调度算法的改进效果 • 合理划分物流范围 • 节省调度运力，提升商户配送能力 • 云端虚拟队列，实现调度指派 • 提升物流效率仿真系统实时监控时光机寻宝系统 1 2 3 4 5 时光机系统—历史数据可视化分析时光机系统—历史数据可视化分析真实再现调度场景细节回溯定位异常调度原因，诊断调试算法 18 1 实时监控系统—当前状况实时监控 19 实时获取调度监控指标及时预警引入人工干预 2 仿真系统—未来效果仿真预测订单在岗骑士数量调度算法餐厅出餐时间骑士速度等待用户时长骑士路线/ 任务规划精准模拟实际订单分布情况有效评估调度算法的改进效果 3 20 寻宝系统—线下优化运营优化指导

0 码力 | 28 页 | 6.86 MB | 1 年前
3
超大规模深度学习在美团的应用-余建平

美团应用场景简介 • 场景特点 亿级的用户，千万级的O2O商品 海量的用户行为，完整的交易闭环 LBS相关的推荐 • 模型特点 百亿级别的训练数据 千亿级别的模型特征 秒级实时的模型反馈目录 • 美团超大规模模型场景简介 • 超大规模机器学习MLX  MLX平台目标  MLX平台架构 • 模型场景应用  召回模型  排序模型超大规模模型的有效性基于ANN的向量相似度检索  Item侧离线计算，形成ANN词表  用户侧向量实时计算，通过ANN找出相似item向量召回模型设计 • LBS的负例采样  与位置相关的negative sampling 样本 & 特征设计 • 特征设计  用户侧：能设计完整的特征，个性化，实时特征  Item侧：预计算带来的副作用，不能使用实时特征点击(+) 仅曝光同地域全体集合分布偏差大 2. DeepFM 3. Deep Cross 树模型小规模DNN 大规模离散DNN • 超大规模深度学习  工程实现  数据并行、模型并行  在线、近线、离线逻辑一致性  实时模型  业务应用  召回模型，ANN搜索  粗排模型，模型预计算  精排模型，大规模离散DNN 总结

0 码力 | 41 页 | 5.96 MB | 1 年前
3
QCon北京2018-《深度学习在微博信息流排序的应用》-刘博

互动性好 • 信噪比低 Ø 排序目标 • 提高用户的信息消费效率 • 提升用户黏性技术挑战 Ø 规模大 • 用户和Feed内容数量大 Ø 指标量化 • 用户体验 • 内容更新快，实时性要求高 • 内容形式多样、非结构化 • 海量计算、超大规模模型优化 1 2 3 深度学习应用与实践常规CTR方法排序微博Feed流排序场景介绍目录 CTR概要介绍数据 • 相关系数评估 • 特征组合 • GBDT+互信息——有效挖掘非线性特征及组合皮尔逊相关系数特征评估标签匹配度特征相关系数特征评估样本采集 Ø 存在问题 • 头部效应 • 实时反馈类收集与在线存在差异性 Ø 解决方案 • 正负样本比例严重失衡 • 对头部曝光进行降采样，长尾曝光上采样 • 负样本进行下采样 • 后端样本预采样模型评估 Ø 离线评估 • AUC 内容特征组合特征标签匹配度用户互动率协同特征实时互动率 app互动率微博内容关注数据用户信息视觉标签打码日志社交关系用户特征发博流互动流曝光流模型服务模型训练模型优化模型评估模型预测 CTR预估排序策略权值映射业务排序其他策略特征工程特征存储特征查询实时数据自解释特征 1 2 3 深度学习应用与实践

0 码力 | 21 页 | 2.14 MB | 1 年前
3
机器学习课程-温州大学-02深度学习-神经网络的编程基础

Gradient Descent）梯度下降的每一步中，都用到了所有的训练样本参数更新 ??: = ?? − ? 1 ? ෍ ?=1 ? ℎ ?(?) − ?(?) ⋅ ?? (?) (同步更新?? ，(j=0,1,...,n )) 梯度学习率 13梯度下降的三种形式随机梯度下降（Stochastic Gradient Descent） ? = ? − ? ⋅ ??(?) Descent）梯度下降的每一步中，用到一个样本，在每一次计算之后便更新参数，而不需要首先将所有的训练集求和参数更新 ??: = ?? − ? ℎ ?(?) − ?(?) ??(?) (同步更新?? ，(j=0,1,...,n )) 15 梯度下降的三种形式小批量梯度下降（Mini-Batch Gradient Descent）梯度下降的每一步中，用到了一定批量的训练样本 =batch_size，通常是2的指数倍，常见有32,64,128等。（小批量梯度下降,MBGD）参数更新 ??: = ?? − ? 1 ? ෍ ?=? ?+?−1 ℎ ?(?) − ?(?) ?? (?) (同步更新?? ，(j=0,1,...,n )) 16 逻辑回归的梯度下降小批量梯度下降（Mini-Batch Gradient Descent）梯度下降的每一步中，用到了一定批量的训练样本

0 码力 | 27 页 | 1.54 MB | 1 年前
3

共 18 条前往

页

分类

语言

格式

微博在线机器学习和深度学习实践-黄波

从推荐模型的基础特点看大规模推荐类深度学习系统的设计袁镱

阿里云上深度学习建模实践-程孟力

【PyTorch深度学习-龙龙老师】-测试版202112

动手学深度学习 v2.0

复杂环境下的视觉同时定位与地图构建

经典算法与人工智能在外卖物流调度中的应用

超大规模深度学习在美团的应用-余建平

QCon北京2018-《深度学习在微博信息流排序的应用》-刘博

机器学习课程-温州大学-02深度学习-神经网络的编程基础