百亿级别训练数据 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

超大规模深度学习在美团的应用-余建平

jpg) 扫码了解更多信息 ## 自我介绍 2011年硕士毕业于南京大学计算机科学与技术系。毕业后曾在百度凤巢从事机器学习工程相关的工作，加入美团后，负责超大规模机器学习系统，从无到有搭建起支持千亿级别规模的深度学习系统，与推荐、搜索、广告业务深度合作，在算法上提供从召回到排序的全系统优化方案，在工程上提供离线、近线、在线的全流程解决方案。 ## 目录美团超大规模模型场景简介 - 超大规模机器学习MLX [Image](/uploads/documents/a/6/1/7/a61721cdcee80359e0d8383fee6d6fec/p6_42.jpg) 我的美团广告 ## 美团应用场景简介百万级活跃商家千万级别POI ![Image](/uploads/documents/a/6/1/7/a61721cdcee80359e0d8383fee6d6fec/p7_1.jpg) ![Image](/upl cee80359e0d8383fee6d6fec/p7_9.jpg) 千亿规模模型预估百亿级训练样本大规模机器学习秒级实时反馈 · 场景特点 ✓亿级的用户，千万级的O2O商品 √海量的用户行为，完整的交易闭环 ✓LBS相关的推荐 · 模型特点 √百亿级别的训练数据 ✓千亿级别的模型特征 ✓秒级实时的模型反馈 ## 目录美团超大规模模型场景简介 - 超大规模机器学习MLX

0 码力 | 41 页 | 5.96 MB | 2 年前
3
数据迁移

## 数据迁移 ## 存量 MySQL 迁移到 TiDB 服务 UDTS 产品支持 MySQL(5.5/5.6/5.7/8.0) 到 TiDB 的全量数据迁移，及增量数据同步。可协助用户在不停机的情况下轻松将业务从 MySQL 切换至 TiDB。 ## 自建 TiDB 迁移到 TiDB 服务 UDTS 产品支持 TiDB 全量数据迁移至 TiDB 服务。用户在源 TiDB 开启 Pump, Drainer 可进行数据增量同步。UDTS 与源端 Pump, Drainer 一起可协助用户在不停机的情况下轻松将业务从自建 TiDB 切换至 TiDB 服务。 ## 为 TiDB 服务建立 MySQL 从库 UDTS 产品支持 TiDB 全量数据迁移至 MySQL 数据库。用户在 TiDB 服务上开启 Binlog 可将数据增量同步至下游 MySQL。UDTS 与 TiDB Binlog Binlog 服务一起可协助用户轻松建立 MySQL 从库。 ## 为 TiDB 服务建立 TiDB 从库 UDTS 产品支持 TiDB 全量数据迁移至 TiDB 数据库。用户在源 TiDB 服务上开启 Binlog 可将数据增量同步至下游 TiDB。UDTS 与 TiDB Binlog 服务一起可协助用户轻松建立 TiDB 从库。

0 码力 | 2 页 | 42.01 KB | 1 年前
3
RNN训练难题

## PyTorch ## RNN训练难题主讲人：龙良曲 ![Image](/uploads/documents/a/b/d/0/abd0d9394eecc78a1f9d9c6dec4ff1e4/p2_1.jpg) ## Simple Yet? Nothing is straightforward. ![Image](/uploads/documents/a/b/d/0/abd0d93

0 码力 | 12 页 | 967.80 KB | 2 年前
3
2 使用Python训练和部署低精度模型张校捷

[Image](/uploads/documents/a/3/b/b/a3bbe1f6675c3cec959e1f224b976c60/p1_2.jpg) PYTHON 30th ## 使用Python训练和部署低精度模型 (TensorFlow版) 张校捷 2019/9/21 ## 目录 >> 低精度的概念和意义 TensorFlow的FP16模型 >> TensorRT的FP16/Int8模型 n_lists.h ![Image](/uploads/documents/a/3/b/b/a3bbe1f6675c3cec959e1f224b976c60/p14_2.jpg) ## FP16训练模型精度 Table 1: ILSVRC12 classification top-1 accuracy. |Model|Baseline|Mixed Precision|Reference|

0 码力 | 24 页 | 981.45 KB | 2 年前
3
Rust OS 开源操作系统训练营的教与学-0615-李明

17-6.18 @Shanghai Rust China Conf 2023 # Rust OS 开源操作系统训练营的教与学李明清华大学 2023-6-17 ## 1 Rust OS 开源训练营的起因和发展 ## 鹏城实验室 PENGCHENG LABORATORY ## 开源操作系统训练营的起源（2020年） ![Image](/uploads/documents/7/a/5/f/7a5 (D60)|30|||| 训练营过去三年的发展情况 2020年 ~ 2022年 • 2020年 • 夏季训练营 2020.7.1 ~ 8.31 • 2021年 CSCC 全国大学生计算机系统能力大赛 • 夏季训练营 2021.7.1 ~ 7.31 2022年 CSCC 全国大学生计算机系统能力大赛 • 夏季训练营 2022.7.3 ~ 8.31 • 秋冬季训练营 2022.10.16 Hub of OS Kernel ## 2023 开源操作系统训练营 • 2023.05.27：在5月底前完成第二阶段 rCore OS 实验的全部内容，排行榜分数达到500分（满分）或类似的能力证明的同学，可联系李明老师了解详情，参加内容丰富的线下实习计划。实习地点在北京/济南。 ·2023.05.07：部分已经完成训练营第二阶段训练的同学，可联系李明老师，与全国的学生/工程师一起参加各种有趣挑战性的小项目

0 码力 | 26 页 | 2.62 MB | 2 年前
3

SQLite 数据转 Mysql

# SQLite 数据转 Mysql #### I nsMsgServer 3.7.6 ## 当前 InHgServer 环境以下过程在 win7 sp1 x64 系统下完成, 如果您的系统不能运行以下相关程序, 请将服务器的 db/ 目录下的 IMBase.dat 文件复制到 win7 sp1 x64 系统下完成 ![Image](/uploads/documents/8/3/a/e/ p1_2.jpg) ## 利用 InHgServer 生成 Mysql 数据库确保 mysql 数据库中没有 IM 相关库 ![Image](/uploads/documents/8/3/a/e/83ae2e54cc4ee64710cafd653e8413de/p2_1.jpg) 调整使用 Mysql 作为数据库，并点击启动 ![Image](/uploads/documents /8/3/a/e/83ae2e54cc4ee64710cafd653e8413de/p2_2.jpg) 确认启动后数据库正确建立

InsMsgServer Start(2017-12-17 05:59:25)
General	Data	Network 0 码力 \| 17 页 \| 1.40 MB \| 2 年前 3 Flink如何实时分析Iceberg数据湖的CDC数据 Flink如何实时分析Iceberg数据湖的CDC数据阿里巴巴李劲松/胡争 FLINK FORWARD #ASIA 2020 #1 #2 #3 #4 常见的CDC 为何选择 Flink 如何实时写未来规划分析方案 + Iceberg 入读取 FLINK FORWARD #ASIA 2020 ## #1 常见的CDC分析方案 ## 离线 HBase 集群分析 CDC 数据 ↓ ## MySQL 3、通过RegionServer定位HFile，Server的优化和缓存完全用不上。 4、数据格式绑定HFile，不方便拓展到Parquet、Avro、Orc等。 FLINK FORWARD #ASIA 2020 ## Apache Kudu 维护 CDC 数据集 ## MySQL ## 方案评估优点 1、支持实时更新数据，时效性佳。 2、列存加速，适合OLAP分析。 ## 缺点 1、独立的Kudu集群，比较小众。维护成本高。等割裂。数据独立，且存储成本不如 S3 / OSS。 3、Kudu的批量扫描不如parquet。 4、不支持增量拉取。 FLINK FORWARD #ASIA 2020 ## MySQL → GQOOP → HVE ## 方案评估优点 1、流程能工作 2、Hive存量数据不受增量数据影响。 ## 缺点 1、数据不是实时写入； 2、每次数据导致都要 MERGE 存量数据。T+1 0 码力 \| 36 页 \| 781.69 KB \| 2 年前 3 Moonshot AI 介绍 Diffusion等AI模型成功的关键组件；发明了Transformer-XL，是历史上第一个在词级别和字级别都全面超越RNN的注意力语言模型，解决了语言建模上下文长度的关键问题，定义了语言建模的新标准；曾与DeepMind和CMU合作研究，首次实现小样本性能逼近全监督学习的高效对齐方法。 ii. 视觉方面。团队成员发明了MoCo，引爆了基于对比学习的视觉预训练范式，也是过去三年CVPR引用量最高的工作；发明了ShuffleN I RL联创及负责人John Schulman亲自邀请加盟。 iv. 基础设施方面。团队核心成员曾带领数十人从零开发世界领先的深度学习框架，也具备数千卡集群全自动化硬件运维告警、数百亿特征检索、大规模（数十PB数据、百万台机器）分布式系统数量级性能优化的经验。 c. 目前团队人数超过 80 人，每个月都有在全球某个领域有显著影响力的人加入。 ### 2. 团队聚焦底层技术创新，技术Vision强 Length上追上来，且在精度（无损记忆）和中文能力上Kimi智能助手依然领先。 b. 聚焦底层技术创新，不走技术捷径。最早提出 “Lossless Long Context 可以解决 90% 以上的模型定制问题”，坚持对数据的无损压缩，实现模型能力的提升，不走技术捷径（通过滑动窗口、降采样、小模型等技术实现上下文窗口延长，都是 “技术捷径”） c. 通过这篇文章，您可以了解更多技术方面信息：专访月之暗面杨植麟：lossless 0 码力 \| 74 页 \| 1.64 MB \| 2 年前 3 运维上海2017-机器学习模型训练的Kubernetes实践-袁晓沛 ## 七牛AI训练业务的K8S实践袁晓沛七牛容器云负责人 ## QCon 全球软件开发大会 10⽉17-19⽇上海·宝华万豪酒店 ![Image](/uploads/documents/1/e/a/e/1eae6abc6c8389e508255ddf048c8d7f/p2_1.jpg) 扫码锁定席位 ## 九折即将结束团购还享更多优惠，折扣有效期至9月17日扫描右方二维码即可查看大会信息及购票扫描添加E小欧，邀您进入EGO会员预报名群立即报名 TECHNOLOGY EGO ## TABLE OF CONTENTS AI训练的业务情况 AI训练的痛点为什么用K8S 基于K8S的AI训练一次踩坑经历接下来的工作 ## AI训练流程 ![Image](/uploads/documents/1/e/a/e/1eae6abc6c8389e508255ddf048c8d7f/p6_1 创建训练样本集 Name 供训练任务高速读取 resize, shuffle, stats 训练参数 ServingGate 开放 API 访问私有 API 访问按版本访问启动训练模型推理 API AppName, AppVersion 一键部署分阶段发布分布式、容器化发布启动评测独立评测任务ID 容器化评测参数 ## AI训练迭代原始数据 0 码力 \| 39 页 \| 5.82 MB \| 2 年前 3 美团点评2018技术年货美团DB数据同步到数据仓库的架构与实践 ..... 66 不可不说的Java“锁”事 ..... 74 境外业务性能优化实践 ..... 91 美团广告实时索引的设计与实现 ..... 106 大众点评账号业务高可用进阶之路 ..... 123 美团容器平台架构及容器技术实践 ..... 135 美团即时物流的分布式系统架构设计 ..... 147 美团点评运营数据产品化应用与实践美团点评运营数据产品化应用与实践 ..... 154 美团服务体验平台对接业务数据的最佳实践-海盗中间件 ..... 167 美团点评智能支付核心交易系统的可用性实践 ..... 176 卫星系统——酒店后端全链路日志收集工具介绍 ..... 192 深入浅出排序学习：写给程序员的算法系统开发实践 ..... 200 每天数百亿用户行为数据，美团点评怎么实现秒级转化分析？ ..... 220 # A IT，寓意是App的运营配置工具（Kit）。通过不断的实践和总结，我们希望能从三个维度解决上述问题： ## 数据JSON化随着业务的不断迭代，无论采用怎样的数据字段组成，都无法满足业务变化的字段（这里是指像标题、副标题、图片、跳转链接等）要求。对底层数据进行JSON化，其对应的数据字段完全可动态扩展，从而满足业务不断迭代的需求。JSON化随之也会带来运营位字段管理的问题，我们通过字段管理的工具来解决这个问题。 0 码力 \| 229 页 \| 61.61 MB \| 2 年前 3 共 1000 条 1 2 3 4 5 6 100 前往页相关搜索词超大规模深度学习美团 MLX平台百亿级别训练数据千亿级别模型特征 UDTS 数据迁移增量同步 TiDB MySQL RNN LSTM 梯度消失梯度爆炸 PyTorch 低精度模型 TensorFlow FP16 Int8 TensorRT Rust编程 RISC-V架构操作系统内核组件化设计 Hypervisor SQLite 数据导出 SQL Maestro 数据导入 Flink Iceberg数据湖 CDC数据增量拉取实时分析大模型长上下文 AI技术 Kimi智能助手开放平台 Kubernetes 分布式训练容器化 AI训练 Ceph 美团点评技术年货核心交易系统智能支付容器平台关于我们文库协议联系我们意见反馈免责声明本站文档数据由用户上传或本站整理自互联网，不以营利为目的，供所有人免费下载和学习使用。如侵犯您的权益，请联系我们进行删除。 IT文库 ©1024 - 2026 \| 站点地图 Powered By MOREDOC AI v3.5.0-beta.10

搜索

分类

语言

格式