2022年美团技术年货 合辑2022美团技术年货 CODE A BETTER LIFE — 年度合集 — ## 序 新春将至,一年一度的美团技术年货也如约到来! 时间煮雨,岁月缝花,花开无声,花谢无语。2022这一年,我们一起经历了无数的悲喜,也留下了满满的回忆。 也许生活就是这样,只有历尽波澜,才能欣赏茫茫大海的辽阔和无边,才能感受到漫天星辰的光芒和温暖。 在2023年春节到来之际,我们从去年美团技术团队公众号上 精选了60多篇技术文章,整理制作成一本1300多页的电子书,作为新年礼物赠送给大家。 这本电子书内容覆盖算法、前端、后端、数据、安全等多个技术领域,希望能对同学们的工作和学习有所帮助。 也欢迎大家转给更多有相同兴趣、积极上进的同事和朋友们,一起切磋,共同成长。 祝愿2023年,大家诸事顺遂,健康平安。  微信扫码关注美团技术团队 CODE A BETTER LIFE 一行代码 亿万生活 ## 目录 算法 YOLOv6:又快又准的目标检测框架开源啦 目标检测开源框架 YOLOv6 全面升级,更快更准的 2.0 版本来啦 通用目标检测开源框架 YOLOv6 在美团的量化部署实战 7 次 KDD Cup&Kaggle 冠军的经验分享:从多领域优化到 AutoML 框架0 码力 | 1356 页 | 45.90 MB | 2 年前3
2020美团技术年货 算法篇# 2020 美团技术年货 CODE A BETTER LIFE 【算法篇】  美团美团 ## 目录 算法 智能搜索模型预估框架 Augur 的建设与实践 1 Transformer 在美团搜索排序中的实践 23 BERT 在美团搜索核心排序的探索和实践 一站式机器学习平台建设实践 77 美团搜索中 NER 技术的探索与实践 92 KDD Cup 2020 Debiasing 比赛冠军技术方案及在美团的实践 113 ICRA 2020 轨迹预测竞赛冠军的方法总结 132 KDD Cup 2020 AutoGraph 比赛冠军技术方案及在美团的实践 141 KDD Cup 2020 多模态召回比赛亚军方案与搜索业务应用 161 CIKM 美团内部讲座 | 清华大学莫一林:信息物理系统中的安全控制算法 235 KDD Cup 2020 多模态召回比赛季军方案与搜索业务应用 252 对话任务中的“语言-视觉”信息融合研究 267 ICDM 论文:探索跨会话信息感知的推荐模型 278 自然场景人脸检测技术实践 289 技术解析 | 横纵一体的无人车控制方案 304 ## 算法 # 智能搜索模型预估框架 Augur 的建设与实践0 码力 | 317 页 | 16.57 MB | 2 年前3
Hello Agents V1.0.2 (从零开始构建智能体)language Chinese GitHub Project 在线阅读 Online Reading 项目介绍 如果说2024年是"百模大战"的元年,那么2025年无疑开启了"Agent元年"。技术的焦点正从训练更大的基础模型,转向构建更聪明的智能体应用。然而,当前系统性、重实践的教程却极度匮乏。为此,我们发起了Hello-Agents项目,希望能为社区提供一本从零开始、理论与实战并重的智能体系统构建指南。 Agent。本教程旨在带领大家深入理解并构建后者——真正的AI Native Agent。教程将带领你穿透框架表象,从智能体的核心原理出发,深入其核心架构,理解其经典范式,并最终亲手构建起属于自己的多智能体应用。我们相信,最好的学习方式就是动手实践。希望这本教程能成为你探索智能体世界的起点,能够从一名大语言模型的"使用者",蜕变为一名智能体系统的"构建者"。 快速开始 在线阅读 点击这里开始在线阅读-无需下载,随时随地学习 理解核心原理深入理解智能体的概念、历史与经典范式 亲手实现掌握热门低代码平台和智能体代码框架的使用 自研框架HelloAgents 基于 Openai 原生 API 从零构建一个自己的智能体框架 掌握高级技能一步步实现上下文工程、Memory、协议、评估等系统性技术 -模型训练掌握 Agentic RL,从 SFT 到 GRPO的全流程实战训练 LLM 驱动真实案例实战开发智能旅行助手、赛博小镇等综合项目 □求职面试学习智能体求职相关面试问题0 码力 | 633 页 | 58.72 MB | 1 月前3
Claude Opus 4.7 System Card 中文版模型福祉:AI有感受吗? Model Welfare Assessment PART IV · 能力基准 12 编程与推理能力 Coding and Reasoning Capabilities 13 多模态、搜索与真实世界任务 Multimodal, Search and Real-World Tasks 14 附录 Appendix §01 引言:Claude Opus 4.7是什么 Introduction: 章介绍其训练过程、使用政策和发布决策。 Claude Opus 4.7是Anthropic推出的新型大语言模型,在软件工程、知识工作、Agent式工具使用和计算机操控等领域尤为擅长。在本系统安全卡(System Card)中,我们报告了对该模型能力和安全特征进行的大范围评估结果。 1.1 模型训练与特性 Model Training and Characteristics 1.1.1训练数据与流程Training 1训练数据与流程Training Data and Process Claude Opus 4.7的训练使用了专有的数据混合体,包括来自互联网的公开信息、公开和私有数据集,以及由其他模型生成的合成数据。在整个训练过程中,我们使用了多种数据清洗和过滤方法,包括去重和分类。 我们使用名为ClaudeBot的通用网络爬虫从公开网站获取训练数据。该爬虫遵循行业标准做法,尊重网站运营者在"robots.txt"中指示的爬取偏0 码力 | 128 页 | 9.92 MB | 1 月前3
【PyTorch深度学习-龙龙老师】-测试版2021127.8 Himmelblau 函数优化实战 7.9 反向传播算法实战 7.10 参考文献 第8章 PyTorch 高级用法 8.1 常见功能模块 8.2 模型装配、训练与测试 8.3 模型保存与加载 8.4 自定义类 8.5 模型乐园 8.6 测量工具 8.7 可视化 8.8 参考文献 第9章 过拟合 9.1 模型的容量 9.2 短时记忆 11.8 LSTM 原理 11.9 LSTM 层使用方法 11.10 GRU 简介 11.11 LSTM/GRU 情感分类问题再战 11.12 预训练的词向量 11.13 参考文献 第12章 自编码器 12.1 自编码器原理 12.2 MNIST 图片重建实战 12.3 自编码器变种 12.4 生成对抗网络 13.1 博弈学习实例 13.2 GAN 原理 13.3 DCGAN 实战 13.4 GAN 变种 13.5 纳什均衡 13.6 GAN 训练难题 13.7 WGAN 原理 13.8 WGAN-GP 实战 13.9 参考文献 第 14 章 强化学习 14.1 先睹为快 14.2 强化学习问题0 码力 | 439 页 | 29.91 MB | 2 年前3
阿里云上深度学习建模实践-程孟力[Image](/uploads/documents/1/d/a/d/1dad8f36ab12a6f672a7eda43f921b9d/p3_4.jpg) ## 电子发票 请问您的公司抬头是什么?(比如:淘宝技术有限公司) 智能对话系统  图像检索 手里面只有5张图片, 怎么搞出来一个效果还 不错的模型? ### 1. 方案复杂 流程长、环节多: 推荐场景: 召回 + 粗排 + 精排 + 多样性/冷启动 实人认证:卡证识别 + 人脸检测 + 活体检测 + 人脸识别 ## 问题: ✗ 方案复杂→周期长/见效慢 ✗ 细节多→难免踩坑 ## 模型构建: Data + Model 要求: + 准确: 低噪声 模型选型: 模型选型: 全面: 同分布 容量大 ✓ 计算量小 Compute Platform 解决方案: 标准化 ✓ 标准化模型库 ✓ 标准化解决方案 训练推理: 高qps, 低rt ✓ 支持超大模型 ✓ 性价比 ## 标准化: Standard Libraries and Solutions Solutions 图像 语音 NLP 视频理解 推荐 搜索 广告 Librarys0 码力 | 40 页 | 8.51 MB | 2 年前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单北京航空航天大学 高研院 助理教授 清华大学新闻学院与人工智能学院双聘教授 沈阳团队博士后 何静 ## 目录 能做什么? 二 要怎么做? 三 效果如何? ## 能做什么? ## 本质:以多agent实现从数据采集到可视全流程 数据采集  平衡性能:在模型大小和性能之间取得平衡,适合中等规模任务。 ☐ 多模态支持:支持文本和图像处理,扩展应用场景。 ☐ 可解释性:注重模型输出的可解释性和透明性。 Kimi k1.5 ☐ 垂直领域优化:针对特定领域(如医疗、法律)进行优化,提供高精度结果。 ☐ 长文本处理:擅长处理长文本和复杂文档,适合专业场景。 ☐ 定制化能力:支持用户自定义训练和微调,适应特定需求。 ## 爬虫数据采集 ## 任务 客运量信息,请从中读取每一天的信息,并整理成一张表格,要求包括以下几项信息:1.当天日期;2.当天的铁路客运量、比2024年同期多或者少的百分比、环比的百分比。3.当天的公路客运量、比2024年同期多或者少的百分比、环比的百分比。4.当天的民航客运量、比2024年同期多或者少的百分比、环比的百分比。 ## DeepSeek R1 能够详细全面地提取文件中的数据,并整理成可视化数据表格,逻辑性强、指标清晰。0 码力 | 85 页 | 8.31 MB | 1 年前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502/6/5/8/8/658893fe61e0eb361f0c042a91e785ad/p2_1.jpg) ## AI给了一个比互联网更大的机会 互联网是连接平台,人工智能是生产力 互联网是赋能性技术,生产力属性较弱 人工智能既能单兵作战,也能外部赋能 ## 建立AI信仰 大模型是真智能,是人工智能的重大拐点。你相不相信? 大模型是一场工业革命,将重塑所有产品和业务。你相不相信? 不拥抱 不拥抱AI的组织和个人,会被拥抱AI的组织和个人淘汰。你相不相信? 现在看不懂、看不清、看不起,未来就看不见了 ## 大模型不是泡沫,而是新一轮工业革命的驱动引擎 人工智能是新质生产力的关键支撑技术,人工智能+百业千行将带动新一轮工业革命,为高质量发展注入强大动能 大模型的进一步突破将引领人类社会进入智能化时代,对我们的生活方式、生产方式带来巨大变革  专家系统 感知AI 多模态AI 认知AI 生成式AI 推理式AI0 码力 | 76 页 | 5.02 MB | 1 年前3
机器学习课程-温州大学-12深度学习-自然语言处理和词嵌入第一步,先从大量的文本集中学习词嵌入。 第二步,你可以用这些词嵌入模型把它迁移到你的新的只有少量标注训练集的任务中,比如说用这个300维的词嵌入来表示你的单词。这样做的一个好处就是你可以用更低维度的特征向量代替原来的10000维的one-hot向量,现在你可以用一个300维更加紧凑的向量。 第三步,当你在你新的任务上训练模型时,在你的命名实体识别任务上,只有少量的标记数据集上,你可以自己选择要不要继续微调,用新的数据调整词嵌入。 Word2Vec 04 GloVe 05 GPT ### 3 \.Word2Vec ## 语言模型的训练机制就是这样 1. 我们获得了大量文本数据(例如,所有维基百科文章)。然后 2. 我们有一个窗口(比如说三个单词),我们会对所有文本进行滑动。 3. 滑动窗口为我们的模型生成训练样本 系统谋划,加快构建满足人工智能产业高质量发展和“人工智能+”高水平赋能需求的标准体系,夯实标准对推动技术进步、促进企业发展、引领产业升级、保障产业安全的支撑作用,更好推进人工智能赋能新型工业化,特制定本指南。 ## 一、 产业发展现状 人工智能是引领新一轮科技革命和产业变革的基础性和战略性技术,正成为发展新质生产力的重要引擎,加速和实体经济深度融合,全面赋能新型工业化,深刻改变工业生产模式和经 要包括算力、算法和数据,框架层主要是指用于模型开发的深度学习框架和工具,模型层主要是指大模型等技术和产品,应用层主要是指人工智能技术在行业场景的应用。近年来,我国人工智能产业在技术创新、产品创造和行业应用等方面实现快速发展,形成庞大市场规模。伴随以大模型为代 表的新技术加速迭代,人工智能产业呈现出创新技术群体突破、行业应用融合发展、国际合作深度协同等新特点,亟需完善人工智能产业标准体系。 ## 二、 安全,加快赋能新型工业化,以抢抓人工智能产业发展先机为目标,完善人工智能标准工作顶层设计,强化全产业链标准工作协同,统筹推进标准的研究、制定、实施和国际化,为推动我国人工智能产业高质量发展提供坚实的技术支撑。 到 2026 年, 标准与产业科技创新的联动水平持续提升, 新制定国家标准和行业标准 50 项以上, 引领人工智能产业高质量发展的标准体系加快形成。开展标准宣贯和实施推广的企业超过 10000 码力 | 13 页 | 701.84 KB | 1 年前3
共 1000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 100













