超大规模深度学习在美团的应用-余建平
5.96 MB
41 页
0 评论
| 语言 | 格式 | 评分 |
|---|---|---|
中文(简体) | .pdf | 3 |
| 摘要 | ||
文档主要介绍了美团在推荐、搜索和广告业务中应用超大规模深度学习的经验。余建平从美团的业务场景出发,详细描述了超大规模模型的应用场景,包括召回模型和排序模型,并提到了MLX平台的目标和架构。文中还提到了VC维理论,强调了数据、特征和模型在机器学习能力中的作用,其中大规模离散特征和DNN模型被认为更优。美团的应用场景具有海量数据、完整的交易闭环和LBS相关推荐的特点。 | ||
| AI总结 | ||
## 美团深度学习实践总结
本次分享由美团点评用户平台研究员余建平进行,重点介绍了美团在超大规模深度学习领域的探索与应用。
### 个人背景
余建平曾在百度凤巢从事机器学习工程工作,加入美团后主导搭建支持千亿级别深度学习系统,与推荐、搜索、广告等核心业务深度合作,提供全流程优化方案。
### 美团应用场景
- **场景特点**:
- **数据规模**: 服务于亿级用户和千万级O2O商品。
- **行为数据**: 处理海量用户行为数据,并具备完整交易闭环。
- **场景特性**: 重度依赖位置_based_服务推荐。
- **模型特点**:
- **训练数据**: 达到百亿级别。
- **模型特征**: 构建千亿级特征。
- **系统实时性**: 提供秒级实时反馈能力。
### 超大规模深度学习系统MLX
- **平台目标**:
- 支持千亿规模的深度学习。
- 实现离线、近线、在线全流程覆盖。
- **平台架构**:
- 专为大规模深度学习设计,支持召回、排序等核心业务场景。
- **系统价值**:
- 为美团推荐、搜索、广告等关键业务提供强有力的算法支撑。
- 在工程实现上,实现了离线、近线、在线的全流程覆盖,构建了完整的深度学习解决方案。
### 模型有效性
从理论层面,系统采用VC维理论进行模型能力分析:
- **核心观点**:
- VC维值越大,模型复杂度越高,学习能力越强。
- 系统能力源于数据、特征和模型三个维度的协同优化。
- **关键实现**:
- **数据价值**: 海量数据是模型学习的基础。
- **特征优势**: 大规模离散特征比小规模泛化特征更有优势。
- **模型选择**: 深度网络(DNN)优于树模型和线性模型。
### 典型应用场景
- **召回模型**:
- 应用场景: 各类推荐场景的初步候选集生成。
- 特点: 需要处理极大的候选空间,typically reaches billions of candidates。
- 成果: 在多个业务中实现性能提升,显著优于传统方法。
- **排序模型**:
- 应用场景: 溶液后的精排序阶段。
- 特点: 需要在有限的候选集中进行精确排序。
- 成果: 在搜索、推荐等业务中取得显著效果,实测验证算法能够在业务指标上达到最佳水平。
### 未来探索方向
-技术突破:
- 算法创新: 模型压缩、多任务学习。
- 系统优化: Training efficiency提升、在线推理加速。
-应用拓展:
- 场景扩展: 将深度学习应用到更多业务线。
- 闭环优化: 加强在线学习和实时反馈。
### 总结
余建平 коллег的分享展示了美团点评在深度学习领域的强大实力,以及在实际业务场景中的创新应用。这套系统的成功经验,对行业其他相关业务都具有重要的借鉴意义。 | ||
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
下载文档到本地,方便使用
- 可预览页数已用完,剩余
29 页请下载阅读 -
文档评分













