backbone 0 码力 |
1356 页 |
45.90 MB
| 2 年前 3 标注速度慢
✗ 标注成本高
x 样本分布不均匀
✗ 隐私保护
手里面只有5张图片,
怎么搞出来一个效果还
不错的模型?
### 1. 方案复杂
流程长、环节多:
推荐场景: 召回 + 粗排 + 精排 + 多样性/冷启动
实人认证:卡证识别 + 人脸检测 + 活体检测 + 人脸识别
## 问题:
✗ 方案复杂→周期长/见效慢
✗ 细节多→难免踩坑
## 模型构建:
1/d/a/d/1dad8f36ab12a6f672a7eda43f921b9d/p13_2.jpg)
推荐请求
PAI-Rec — 推荐引擎
PAI-ABTest
A/B流量划分
BE召回/Hologres
x2i hot vec
排序
在线流程
粗排 精排 重排
PAI-EAS — 模型推理
model1
model2
推荐日志
MaxCompute
Flink PAI-Studio一建模平台
召回模型
EasyRec
GraphLearn
排序模型
Alink
模型训练评估
离线流程
## 标准化: Standard Solutions
智能推荐解决方案 > PAI-REC 推荐引擎
PAI-REC平台
PAI-REC 推荐引擎
PAI-REC 配置中心
自动化降级
Pipeline1
Pipeline2
AB实验
负载均衡
多路召回
拉取配置 0 码力 |
40 页 |
8.51 MB
| 2 年前 3 通过数据本地化处理、边缘节点离线自治,解决了云和边缘之间的网络可靠性和带宽限制的问题。
→ 通过大幅优化边缘组件的资源占用(二进制大小约46MB,运行时内存占用约10MB),解决了边缘资源的约束问题。
→ 通过在云边之间构建的双向多路复用网络通道,解决了从云端管理高度分布的海量节点和设备难的问题。
南向支持对接物联网主流的通信协议(MQTT,Bluetooth,Zigbee,BACnet等),解决了异构硬件接入难的问题
## Why 2019)
→ 云端和边缘端的开源实现。
→ 使用 kubectl 从云端向边缘节点部署应用。
→ 使用 kubectl 从云端对边缘节点的应用进行配置管理和密钥管理。
→ 云和边缘节点之间的双向和多路网络通信。
→ Kubernetes Pod 和 Node 状态通过云端 kubectl 查询,从边缘端收集/报告数据。
→ 边缘节点在脱机时自动恢复,并重新连接云端。
→ 支持IoT设备通过Device 0 码力 |
20 页 |
2.08 MB
| 2 年前 3 ·负责全平台数据仓库和数据产品建设
·2011年 百度电子商务事业部
·有啊商城的开发
·2010年毕业于中科院计算所
## 美国点评 技术团队
## Outline
·美团点评酒旅业务简介
·基于用户画像的召回策略演进
·基于L2R的排序策略优化
·从海量大数据的离线计算到高并发在线服务的推荐引擎架构设计
·推荐在美团点评酒旅的应用实践
## 人工智能应用
|CriticalDigital Wo e7ae6238e03c8/p13_6.jpg)
## 基于用户画像的召回策略演进
## 热销策略
基于Deal所在城市统计分城市热销

|分类|场景|召回策略|
|---|---|---|
|本地需求|常驻城市=浏览城市 (北京 [Image](/uploads/documents/f/1/e/8/f1e818b436be25cd166e7ae6238e03c8/p21_1.jpg)
情侣
有车
古北水镇
九华山庄
南山滑雪场
## 召回策略演进过程
本异地热销策略
历史行为强
相关
· 浏览未购买
· 收藏未购买
Location-Based
- 区域热门消费
- 区域热门购买
协同过滤
• Item CF
• 0 码力 |
49 页 |
5.97 MB
| 2 年前 3 0到1搭建美团DSP投放平台,具备丰富的大规模计算引擎的开发和性能优化经验。
霜霜,2015年6月加入美团,任职美团高级工程师,美团DSP系统后端基础架构与机器学习架构负责人,全面负责DSP业务广告召回和排序服务的架构设计与优化。
## 招聘
美团在线营销DSP团队诚招工程、算法、数据等各方向精英,发送简历至cuitao@meituan.com,共同支持百亿级流量的高可靠系统研发与优化。
# Netty堆外内存泄露排查盛宴 HTTP请求重度依赖DNS,DNS劫持、移动端网络不稳定使建连失败,以及公网链路质量差等因素,导致移动端的网络成功率一直不高。HTTP 2.0可以通过SSE、WebSocket等方式与服务端保持长连接,并且可以做到请求多路复用,但HTTP 2.0对运维、前端、后端的改造成本非常高。基于此背景美团自研了Shark服务。一种“代理长连接”的模式,主要用于解决移动设备网络通信质量差的问题。
- Shark在国内和境外部署 设计分解
设计阶段可分解为以下子需求。
## 实时索引
广告场景的更新流,涉及索引字段和各类属性的实时更新。特别是与上下线状态相关的属性字段,需要在若干毫秒内完成更新,对实时性有较高要求。
用于召回条件的索引字段,其更新可以滞后一些,如在几秒钟之内完成更新。采用分而治之的策略,可极大降低系统复杂度。
- 属性字段的更新:直接修改正排表的字段值,可以保证毫秒级完成。
- 索引字段的更新:涉及 0 码力 |
229 页 |
61.61 MB
| 2 年前 3 比赛冠军技术方案及在美团的实践 113
ICRA 2020 轨迹预测竞赛冠军的方法总结 132
KDD Cup 2020 AutoGraph 比赛冠军技术方案及在美团的实践 141
KDD Cup 2020 多模态召回比赛亚军方案与搜索业务应用 161
CIKM 2020 | 一文详解美团 6 篇精选论文 179
MT-BERT 在文本检索任务中的实践 192
美团无人车引擎在仿真中的实践 204 解读 215
WSDM Cup 2020 检索排序评测任务第一名经验总结 225
美团内部讲座 | 清华大学莫一林:信息物理系统中的安全控制算法 235
KDD Cup 2020 多模态召回比赛季军方案与搜索业务应用 252
对话任务中的“语言-视觉”信息融合研究 267
ICDM 论文:探索跨会话信息感知的推荐模型 278
自然场景人脸检测技术实践 289
技术解析 | 针对特征的处理逻辑,我们抽象出两个概念:
Operator:通用特征处理逻辑,根据功能的不同又可以分为两类:
- IO OP:用处理原始特征的获取,如从 KV 里获取数据,或者从对应的第三方服务中获取数据。内置批量接口,可以实现批量召回,减少 RPC。
• Calc OP:用于处理对获取到的原始特征做与模型无关的逻辑处理,如拆分、判空、组合。业务可以结合需求实现特征处理逻辑。
通过 IO、计算分离,特征抽取执行阶段就可以进行 IO 0 码力 |
317 页 |
16.57 MB
| 2 年前 3 ,在算法上提供从召回到排序的全系统优化方案,在工程上提供离线、近线、在线的全流程解决方案。
## 目录
美团超大规模模型场景简介
- 超大规模机器学习MLX
✓ MLX平台目标
✓ MLX平台架构
- 模型场景应用
召回模型
排序模型
## 目录
美团超大规模模型场景简介
- 超大规模机器学习MLX
✓ MLX平台目标
MLX平台架构
模型场景应用
召回模型
排序模型
(仅限平日10:00-14: √百亿级别的训练数据
✓千亿级别的模型特征
✓秒级实时的模型反馈
## 目录
美团超大规模模型场景简介
- 超大规模机器学习MLX
✓ MLX平台目标
✓ MLX平台架构
模型场景应用
✓ 召回模型
排序模型
## 超大规模模型的有效性
## • VC维理论
描述模型的学习能力:VC维越大模型越复杂,学习能力越强
✓ 机器学习能力 = 数据 + 特征 + 模型
• 数据
✓ 海量数据:美团的亿级用户、千万级POI 本;
- 支持Online Learning,提供从近线到在线的模型数据通路;
- 提供从召回到排序全流程的模型解决方案,为业务提供最佳实践;
• 提供系统的平台化工具,为用户提供易用的界面操作;
## MLX平台架构
应用场景 | 推荐 | 搜索 | 广告
解决方案 | 排序模型 | 召回模型 |
MLX | 参数服务器 | 模型计算引擎 | 训练Worker
| 流式拼接框架 0 码力 |
41 页 |
5.96 MB
| 2 年前 3 a49fd8b2d598618d8439fe3a7db198e/p12_1.jpg)
✓多级异常容忍能力,自适应,层级化自治
· 动态参数,自适应
• 预测,online结合nearline召回
能屈能伸:
✓高效简化版本,实现过载兜底
✓周边极致优化,无短板
Best Effort模式

压测
转变
## 人工调整系统参数
各类算法策略参数
● 算力 (CPU, 内存, 实例数)
● 并发数
● TTL时间,超时等
● 召回数, 截断数等

## 自动调整系统参数 jpg)
● 算力 (CPU, 内存, 实例数)
● 并发数
● TTL时间,超时等
● 召回数, 截断数等
## Feed信息流:能屈能伸,Online召回+Nearline召回
• 权衡:矛盾 or 兼顾?
• 召回(获取推荐候选集),需要更弹性?
• 方案:Online+Nearline召回,动态结合
预测,缓存,异步化,触发机制




## 基于标题以出现召回不足
视频 播单 自频道
最新发布 最多播放
![Image](/uploads/documents/2/4/f/8/24f89f2bb1c0f9c7ff9fb33f39a12c8a/p6_5 0 码力 |
24 页 |
9.60 MB
| 2 年前 3
|