多模态自监督预训练技术 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

2022年美团技术年货合辑

2022美团技术年货 CODE A BETTER LIFE — 年度合集 — ## 序新春将至，一年一度的美团技术年货也如约到来！时间煮雨，岁月缝花，花开无声，花谢无语。2022这一年，我们一起经历了无数的悲喜，也留下了满满的回忆。也许生活就是这样，只有历尽波澜，才能欣赏茫茫大海的辽阔和无边，才能感受到漫天星辰的光芒和温暖。在2023年春节到来之际，我们从去年美团技术团队公众号上精选了60多篇技术文章，整理制作成一本1300多页的电子书，作为新年礼物赠送给大家。这本电子书内容覆盖算法、前端、后端、数据、安全等多个技术领域，希望能对同学们的工作和学习有所帮助。也欢迎大家转给更多有相同兴趣、积极上进的同事和朋友们，一起切磋，共同成长。祝愿2023年，大家诸事顺遂，健康平安。 ![Image](/uploads/documents/5/b/1/9/5b19ae81 jpg) 微信扫码关注美团技术团队 CODE A BETTER LIFE 一行代码亿万生活 ## 目录算法 YOLOv6：又快又准的目标检测框架开源啦目标检测开源框架 YOLOv6 全面升级，更快更准的 2.0 版本来啦通用目标检测开源框架 YOLOv6 在美团的量化部署实战 7 次 KDD Cup&Kaggle 冠军的经验分享：从多领域优化到 AutoML 框架

0 码力 | 1356 页 | 45.90 MB | 2 年前
3
2020美团技术年货算法篇

# 2020 美团技术年货 CODE A BETTER LIFE 【算法篇】 ![Image](/uploads/documents/4/2/c/4/42c4fbcf187df0f624a5e70022348082/p1_1.jpg) 美团美团 ## 目录算法智能搜索模型预估框架 Augur 的建设与实践 1 Transformer 在美团搜索排序中的实践 23 BERT 在美团搜索核心排序的探索和实践一站式机器学习平台建设实践 77 美团搜索中 NER 技术的探索与实践 92 KDD Cup 2020 Debiasing 比赛冠军技术方案及在美团的实践 113 ICRA 2020 轨迹预测竞赛冠军的方法总结 132 KDD Cup 2020 AutoGraph 比赛冠军技术方案及在美团的实践 141 KDD Cup 2020 多模态召回比赛亚军方案与搜索业务应用 161 CIKM 美团内部讲座 | 清华大学莫一林：信息物理系统中的安全控制算法 235 KDD Cup 2020 多模态召回比赛季军方案与搜索业务应用 252 对话任务中的“语言－视觉”信息融合研究 267 ICDM 论文：探索跨会话信息感知的推荐模型 278 自然场景人脸检测技术实践 289 技术解析 | 横纵一体的无人车控制方案 304 ## 算法 # 智能搜索模型预估框架 Augur 的建设与实践

0 码力 | 317 页 | 16.57 MB | 2 年前
3
Hello Agents V1.0.2 (从零开始构建智能体)

language Chinese GitHub Project 在线阅读 Online Reading 项目介绍如果说2024年是"百模大战"的元年，那么2025年无疑开启了"Agent元年"。技术的焦点正从训练更大的基础模型，转向构建更聪明的智能体应用。然而，当前系统性、重实践的教程却极度匮乏。为此，我们发起了Hello-Agents项目，希望能为社区提供一本从零开始、理论与实战并重的智能体系统构建指南。 Agent。本教程旨在带领大家深入理解并构建后者——真正的AI Native Agent。教程将带领你穿透框架表象，从智能体的核心原理出发，深入其核心架构，理解其经典范式，并最终亲手构建起属于自己的多智能体应用。我们相信，最好的学习方式就是动手实践。希望这本教程能成为你探索智能体世界的起点，能够从一名大语言模型的"使用者"，蜕变为一名智能体系统的"构建者"。快速开始在线阅读点击这里开始在线阅读-无需下载，随时随地学习理解核心原理深入理解智能体的概念、历史与经典范式亲手实现掌握热门低代码平台和智能体代码框架的使用自研框架HelloAgents 基于 Openai 原生 API 从零构建一个自己的智能体框架掌握高级技能一步步实现上下文工程、Memory、协议、评估等系统性技术 -模型训练掌握 Agentic RL，从 SFT 到 GRPO的全流程实战训练 LLM 驱动真实案例实战开发智能旅行助手、赛博小镇等综合项目 □求职面试学习智能体求职相关面试问题

0 码力 | 633 页 | 58.72 MB | 1 月前
3
Claude Opus 4.7 System Card 中文版

模型福祉：AI有感受吗？ Model Welfare Assessment PART IV · 能力基准 12 编程与推理能力 Coding and Reasoning Capabilities 13 多模态、搜索与真实世界任务 Multimodal, Search and Real-World Tasks 14 附录 Appendix §01 引言：Claude Opus 4.7是什么 Introduction: 章介绍其训练过程、使用政策和发布决策。 Claude Opus 4.7是Anthropic推出的新型大语言模型，在软件工程、知识工作、Agent式工具使用和计算机操控等领域尤为擅长。在本系统安全卡（System Card）中，我们报告了对该模型能力和安全特征进行的大范围评估结果。 1.1 模型训练与特性 Model Training and Characteristics 1.1.1训练数据与流程Training 1训练数据与流程Training Data and Process Claude Opus 4.7的训练使用了专有的数据混合体，包括来自互联网的公开信息、公开和私有数据集，以及由其他模型生成的合成数据。在整个训练过程中，我们使用了多种数据清洗和过滤方法，包括去重和分类。我们使用名为ClaudeBot的通用网络爬虫从公开网站获取训练数据。该爬虫遵循行业标准做法，尊重网站运营者在"robots.txt"中指示的爬取偏

0 码力 | 128 页 | 9.92 MB | 1 月前
3
【PyTorch深度学习-龙龙老师】-测试版202112

7.8 Himmelblau 函数优化实战 7.9 反向传播算法实战 7.10 参考文献第8章 PyTorch 高级用法 8.1 常见功能模块 8.2 模型装配、训练与测试 8.3 模型保存与加载 8.4 自定义类 8.5 模型乐园 8.6 测量工具 8.7 可视化 8.8 参考文献第9章过拟合 9.1 模型的容量 9.2 短时记忆 11.8 LSTM 原理 11.9 LSTM 层使用方法 11.10 GRU 简介 11.11 LSTM/GRU 情感分类问题再战 11.12 预训练的词向量 11.13 参考文献第12章自编码器 12.1 自编码器原理 12.2 MNIST 图片重建实战 12.3 自编码器变种 12.4 生成对抗网络 13.1 博弈学习实例 13.2 GAN 原理 13.3 DCGAN 实战 13.4 GAN 变种 13.5 纳什均衡 13.6 GAN 训练难题 13.7 WGAN 原理 13.8 WGAN-GP 实战 13.9 参考文献第 14 章强化学习 14.1 先睹为快 14.2 强化学习问题

0 码力 | 439 页 | 29.91 MB | 2 年前
3
阿里云上深度学习建模实践-程孟力

[Image](/uploads/documents/1/d/a/d/1dad8f36ab12a6f672a7eda43f921b9d/p3_4.jpg) ## 电子发票请问您的公司抬头是什么？（比如：淘宝技术有限公司）智能对话系统 ![Image](/uploads/documents/1/d/a/d/1dad8f36ab12a6f672a7eda43f921b9d/p3_5.jpg) 图像检索手里面只有5张图片，怎么搞出来一个效果还不错的模型？ ### 1. 方案复杂流程长、环节多：推荐场景: 召回 + 粗排 + 精排 + 多样性/冷启动实人认证：卡证识别 + 人脸检测 + 活体检测 + 人脸识别 ## 问题: ✗ 方案复杂→周期长/见效慢 ✗ 细节多→难免踩坑 ## 模型构建: Data + Model 要求: + 准确: 低噪声模型选型: 模型选型: 全面: 同分布容量大 ✓ 计算量小 Compute Platform 解决方案: 标准化 ✓ 标准化模型库 ✓ 标准化解决方案训练推理: 高qps, 低rt ✓ 支持超大模型 ✓ 性价比 ## 标准化: Standard Libraries and Solutions Solutions 图像语音 NLP 视频理解推荐搜索广告 Librarys

0 码力 | 40 页 | 8.51 MB | 2 年前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

北京航空航天大学高研院助理教授清华大学新闻学院与人工智能学院双聘教授沈阳团队博士后何静 ## 目录能做什么？二要怎么做？三效果如何？ ## 能做什么？ ## 本质：以多agent实现从数据采集到可视全流程数据采集 ![Image](/uploads/documents/8/2/d/9/82d92d1a0d1d8addd115233c124fe2a5/p4_1.jpg) 平衡性能：在模型大小和性能之间取得平衡，适合中等规模任务。 ☐ 多模态支持：支持文本和图像处理，扩展应用场景。 ☐ 可解释性：注重模型输出的可解释性和透明性。 Kimi k1.5 ☐ 垂直领域优化：针对特定领域（如医疗、法律）进行优化，提供高精度结果。 ☐ 长文本处理：擅长处理长文本和复杂文档，适合专业场景。 ☐ 定制化能力：支持用户自定义训练和微调，适应特定需求。 ## 爬虫数据采集 ## 任务客运量信息，请从中读取每一天的信息，并整理成一张表格，要求包括以下几项信息：1.当天日期；2.当天的铁路客运量、比2024年同期多或者少的百分比、环比的百分比。3.当天的公路客运量、比2024年同期多或者少的百分比、环比的百分比。4.当天的民航客运量、比2024年同期多或者少的百分比、环比的百分比。 ## DeepSeek R1 能够详细全面地提取文件中的数据，并整理成可视化数据表格，逻辑性强、指标清晰。

0 码力 | 85 页 | 8.31 MB | 1 年前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

/6/5/8/8/658893fe61e0eb361f0c042a91e785ad/p2_1.jpg) ## AI给了一个比互联网更大的机会互联网是连接平台，人工智能是生产力互联网是赋能性技术，生产力属性较弱人工智能既能单兵作战，也能外部赋能 ## 建立AI信仰大模型是真智能，是人工智能的重大拐点。你相不相信？大模型是一场工业革命，将重塑所有产品和业务。你相不相信？不拥抱不拥抱AI的组织和个人，会被拥抱AI的组织和个人淘汰。你相不相信？现在看不懂、看不清、看不起，未来就看不见了 ## 大模型不是泡沫，而是新一轮工业革命的驱动引擎人工智能是新质生产力的关键支撑技术，人工智能+百业千行将带动新一轮工业革命，为高质量发展注入强大动能大模型的进一步突破将引领人类社会进入智能化时代，对我们的生活方式、生产方式带来巨大变革 ![Image](/uploads/docu 会帮助人类拥有“超级能力” 解决复杂问题 ## AI不仅是技术革新，更是思维方式和社会结构的变革人工智能驱动国家生产力发展，既是科技之争，也是国运之争人工智能将全面变革和优化产业发展格局，重塑经济发展图景人工智能重塑企业发展动力，为所有企业带来弯道超车的机会人工智能打破个人能力瓶颈，使每个人都有机会成为超个体 ## 人工智能发展历程（一）专家系统感知AI 多模态AI 认知AI 生成式AI 推理式AI

0 码力 | 76 页 | 5.02 MB | 1 年前
3
机器学习课程-温州大学-12深度学习-自然语言处理和词嵌入

第一步，先从大量的文本集中学习词嵌入。第二步，你可以用这些词嵌入模型把它迁移到你的新的只有少量标注训练集的任务中，比如说用这个300维的词嵌入来表示你的单词。这样做的一个好处就是你可以用更低维度的特征向量代替原来的10000维的one-hot向量，现在你可以用一个300维更加紧凑的向量。第三步，当你在你新的任务上训练模型时，在你的命名实体识别任务上，只有少量的标记数据集上，你可以自己选择要不要继续微调，用新的数据调整词嵌入。 Word2Vec 04 GloVe 05 GPT ### 3 \.Word2Vec ## 语言模型的训练机制就是这样 1. 我们获得了大量文本数据（例如，所有维基百科文章）。然后 2. 我们有一个窗口（比如说三个单词），我们会对所有文本进行滑动。 3. 滑动窗口为我们的模型生成训练样本 ![Image](/uploads/documents/d/7/b/6/d7b6a575aae04 ### 3 \.Word2Vec Jay was hit by a ___ bus in... |by|a|red|bus|in| |---|---|---|---|---| 我们实际构建和训练模型的数据集将如下所示： |input 1|input 2|input 3|input 4|output| |---|---|---|---|---| |by|a|bus|in|red| 这被

0 码力 | 44 页 | 2.36 MB | 2 年前
3
国家人工智能产业综合标准化体系建设指南（2024版）

系统谋划，加快构建满足人工智能产业高质量发展和“人工智能+”高水平赋能需求的标准体系，夯实标准对推动技术进步、促进企业发展、引领产业升级、保障产业安全的支撑作用，更好推进人工智能赋能新型工业化，特制定本指南。 ## 一、产业发展现状人工智能是引领新一轮科技革命和产业变革的基础性和战略性技术，正成为发展新质生产力的重要引擎，加速和实体经济深度融合，全面赋能新型工业化，深刻改变工业生产模式和经要包括算力、算法和数据，框架层主要是指用于模型开发的深度学习框架和工具，模型层主要是指大模型等技术和产品，应用层主要是指人工智能技术在行业场景的应用。近年来，我国人工智能产业在技术创新、产品创造和行业应用等方面实现快速发展，形成庞大市场规模。伴随以大模型为代表的新技术加速迭代，人工智能产业呈现出创新技术群体突破、行业应用融合发展、国际合作深度协同等新特点，亟需完善人工智能产业标准体系。 ## 二、安全，加快赋能新型工业化，以抢抓人工智能产业发展先机为目标，完善人工智能标准工作顶层设计，强化全产业链标准工作协同，统筹推进标准的研究、制定、实施和国际化，为推动我国人工智能产业高质量发展提供坚实的技术支撑。到 2026 年, 标准与产业科技创新的联动水平持续提升, 新制定国家标准和行业标准 50 项以上, 引领人工智能产业高质量发展的标准体系加快形成。开展标准宣贯和实施推广的企业超过 1000

0 码力 | 13 页 | 701.84 KB | 1 年前
3

共 1000 条前往

页

搜索

分类

语言

格式