pdf文档 超大规模深度学习在美团的应用-余建平

5.96 MB 41 页 0 评论
语言 格式 评分
中文(简体)
.pdf
3
摘要
文档主要介绍了美团在推荐、搜索和广告业务中应用超大规模深度学习的经验。余建平从美团的业务场景出发,详细描述了超大规模模型的应用场景,包括召回模型和排序模型,并提到了MLX平台的目标和架构。文中还提到了VC维理论,强调了数据、特征和模型在机器学习能力中的作用,其中大规模离散特征和DNN模型被认为更优。美团的应用场景具有海量数据、完整的交易闭环和LBS相关推荐的特点。
AI总结
## 美团深度学习实践总结 本次分享由美团点评用户平台研究员余建平进行,重点介绍了美团在超大规模深度学习领域的探索与应用。 ### 个人背景 余建平曾在百度凤巢从事机器学习工程工作,加入美团后主导搭建支持千亿级别深度学习系统,与推荐、搜索、广告等核心业务深度合作,提供全流程优化方案。 ### 美团应用场景 - **场景特点**: - **数据规模**: 服务于亿级用户和千万级O2O商品。 - **行为数据**: 处理海量用户行为数据,并具备完整交易闭环。 - **场景特性**: 重度依赖位置_based_服务推荐。 - **模型特点**: - **训练数据**: 达到百亿级别。 - **模型特征**: 构建千亿级特征。 - **系统实时性**: 提供秒级实时反馈能力。 ### 超大规模深度学习系统MLX - **平台目标**: - 支持千亿规模的深度学习。 - 实现离线、近线、在线全流程覆盖。 - **平台架构**: - 专为大规模深度学习设计,支持召回、排序等核心业务场景。 - **系统价值**: - 为美团推荐、搜索、广告等关键业务提供强有力的算法支撑。 - 在工程实现上,实现了离线、近线、在线的全流程覆盖,构建了完整的深度学习解决方案。 ### 模型有效性 从理论层面,系统采用VC维理论进行模型能力分析: - **核心观点**: - VC维值越大,模型复杂度越高,学习能力越强。 - 系统能力源于数据、特征和模型三个维度的协同优化。 - **关键实现**: - **数据价值**: 海量数据是模型学习的基础。 - **特征优势**: 大规模离散特征比小规模泛化特征更有优势。 - **模型选择**: 深度网络(DNN)优于树模型和线性模型。 ### 典型应用场景 - **召回模型**: - 应用场景: 各类推荐场景的初步候选集生成。 - 特点: 需要处理极大的候选空间,typically reaches billions of candidates。 - 成果: 在多个业务中实现性能提升,显著优于传统方法。 - **排序模型**: - 应用场景: 溶液后的精排序阶段。 - 特点: 需要在有限的候选集中进行精确排序。 - 成果: 在搜索、推荐等业务中取得显著效果,实测验证算法能够在业务指标上达到最佳水平。 ### 未来探索方向 -技术突破: - 算法创新: 模型压缩、多任务学习。 - 系统优化: Training efficiency提升、在线推理加速。 -应用拓展: - 场景扩展: 将深度学习应用到更多业务线。 - 闭环优化: 加强在线学习和实时反馈。 ### 总结 余建平 коллег的分享展示了美团点评在深度学习领域的强大实力,以及在实际业务场景中的创新应用。这套系统的成功经验,对行业其他相关业务都具有重要的借鉴意义。
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
下载文档到本地,方便使用
- 可预览页数已用完,剩余 29 页请下载阅读 -
文档评分
请文明评论,理性发言.