搜索

pdf文档 QCon北京2018-《深度学习在微博信息流排序的应用》-刘博

2.14 MB 21 页 0 下载 100 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pdf
3
摘要
文档主要介绍了深度学习在微博信息流排序中的应用。首先,对比了传统线性CTR模型和深度学习模型的优缺点,指出深度学习在表达能力和泛化能力上的优势。接着,详细介绍了深度学习在微博Feed流排序中的实践,包括Wide & Deep架构的设计、样本采样的方法以及网络复杂度对模型性能的影响。最后,总结了当前模型的应用效果,并展望了未来在多模态、用户行为序列embedding等方面的改进方向。
AI总结
### 总结:深度学习在微博信息流排序中的应用 #### 1. **背景与挑战** 微博作为中国领先的社交媒体平台,拥有庞大的用户基数(DAU 1.72亿,MAU 3.92亿),信息流排序是提升用户体验的核心问题。 - **特点**:内容形式多样(博文、图片、视频等),用户行为复杂,实时性要求高。 - **挑战**:海量数据计算、超大规模模型优化。 #### 2. **传统方法与局限** - **线性CTR模型**:简单高效、可解释性强,但特征工程繁琐,难以表达高维抽象特征。 - **局限性**:难以处理复杂的非线性关系,表达能力有限。 #### 3. **深度学习的应用与优势** - **深度学习模型**:通过DNN(深度神经网络)增强了模型的表达能力和泛化能力,能够更好地捕捉高维抽象特征。 - **Wide & Deep模型**:结合了线性模型和深度模型的优势,通过连续特征离散化和非连续特征embedding,实现了更高效的特征处理。 #### 4. **算法架构与实践** - **样本采样**:采用负采样(Negative sampling),基于用户的平均阅读时间划分负样本。 - **网络复杂度**:实验表明,适当的网络深度(如256,128)能够提升模型性能(logloss降低,wAUC提升),但过深的网络可能导致过拟合。 #### 5. **总结与展望** - **总结**:深度学习在微博信息流排序中取得了显著效果,通过Wide & Deep架构和合理的模型设计,提升了内容推荐的准确性和用户体验。 - **展望**:未来将重点研究多模态模型(如图像、视频的表征)、用户行为序列embedding,以及更复杂的网络结构在CTR预估中的应用。 通过深度学习技术的引入,微博在信息流排序中实现了更智能、更个性化的推荐,显著提升了用户体验。
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
下载文档到本地,方便使用
- 可预览页数已用完,剩余 9 页请下载阅读 -
文档评分
请文明评论,理性发言.