研发效率 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

QCon北京2018-《深度学习在微博信息流排序的应用》-刘博

深度学习在微博Feed流应用实践刘博新浪微博机器学习研发部关系流算法负责人 1 2 3 深度学习应用与实践常规CTR方法排序微博Feed流排序场景介绍目录微博Feed流产品介绍—排序场景 Ø 信息获取方式 • 主动获取（关注） Ø 内容形式 • 博文/文章/图片/视频/问答/话题/… • 被动获取（推荐） Ø 微博—社交媒体领跑者 • DAU：1.72亿，MAU：3 关注流基于关系链接用户与内容微博Feed流特点介绍—排序原因 Ø 产品特点 • 传播性强 Ø 存在问题 • 信息过载 • 互动性好 • 信噪比低 Ø 排序目标 • 提高用户的信息消费效率 • 提升用户黏性技术挑战 Ø 规模大 • 用户和Feed内容数量大 Ø 指标量化 • 用户体验 • 内容更新快，实时性要求高 • 内容形式多样、非结构化 • 海量计算、超大规模模型优化

0 码力 | 21 页 | 2.14 MB | 1 年前
3
QCon北京2018-《未来都市--智慧城市与基于深度学习的机器视觉》-陈宇恒

识别大幅提升精度软银孙正义设立1000亿美元人工智能基金，320亿美元收购芯片架构公司ARM 2016.7 公司简介历史业绩领先技术 20年科研经验 800余位技术研发人员 150余位人工智能博士唯一深度学习平台公司累计融资全球最大核心技术全球领先商业营收市占率行业第一 400余家大型客户伙伴共同发展 AI+金融 AI+智慧城市 scheduling Go语言在高性能系统中的实践经验 • 为什么用Go - 比起C++，更易于实践各种并发模式 - 比起Java，更加简洁，更易于与C/C++交互 - 比起脚本语言，类型和内存安全，保证重构效率与产品质量 - 完善的配套工具，如go test, gofmt, go lint, race-detector Go语言在高性能系统中的实践经验 • Go在开发高性能应用上也有一些不足，对比C++：

0 码力 | 23 页 | 9.26 MB | 1 年前
3
机器学习课程-温州大学-13深度学习-Transformer

RU等）来作为编解码器。RNN模块每次只能够吃进一个输入token和前一次的隐藏状态，然后得到输出。它的时序结构使得这个模型能够得到长距离的依赖关系，但是这也使得它不能够并行计算，模型效率十分低。在没有transformer的时候，我们都是用什么来完成这系列的任务的呢？ 5 1.Transformer介绍 Seq2Seq任务 Seq2Seq 任务指的是输入和输出都是 oder部分并不需要标签，有语料就能训练了 4.BERT Encoder BERT是一个算法模型，它的出现打破了大量的自然语言处理任务的记录。在BERT的论文发布不久后，Google的研发团队还开放了该模型的代码，并提供了一些在大量数据集上预训练好的算法模型下载方式，这使得所有人都可以通过它来构建一个涉及NLP的算法模型，节约了大量训练语言模型所需的时间，精力，知识和资源

0 码力 | 60 页 | 3.51 MB | 1 年前
3
机器学习课程-温州大学-01深度学习-引言

•风格迁移 •三维重建 •图像检索 •GAN 12 深度学习-CV典型应用案例翻译传统翻译采用人工查词的方式，不但耗时长，而且错误率高。图像识别技术(OCR)的出现大大提升了翻译的效率和准确度，用户通过简单的拍照、截图或划线就能得到准确的翻译结果。体育赛事计算机视觉还有助于比赛和策略分析、球员表现和评级，以及跟踪体育节目中品牌赞助的可见性。农业半自动联合收割机可以利用人工智能自动驾驶汽车需要计算机视觉。特斯拉 (Tesla)、宝马(BMW)、沃尔沃(Volvo)和奥迪 (Audi)等汽车制造商Y已经通过摄像头、激光雷达、雷达和超声波传感器从环境中获取图像，研发自动驾驶汽车来探测目标、车道标志和交通信号，从而安全驾驶。安防中国在使用人脸识别技术方面无疑处于领先地位，这项技术被广泛应用于警察工作、支付识别、机场安检，甚至在北京天坛公园分发厕

0 码力 | 80 页 | 5.38 MB | 1 年前
3
深度学习在电子商务中的应用

实验室。 4  程进兴，苏宁美国研究院技术总监，斯坦福大学博士，清华大学本科。曾在甲骨文，雅虎，微软，沃尔玛实验室等多家公司从事搜索，广告，大数据分析，机器学习，人工智能应用等方面的研发工作。在此期间，发表了10多篇相关领域的研究论文，并有10多项相关领域的专利。  业余爱好：骑行个人简介电子邮箱： jim.cheng@ususing.com 5 议程 • 深度学习与商品搜索

0 码力 | 27 页 | 1.98 MB | 1 年前
3
【PyTorch深度学习-龙龙老师】-测试版202112

亿个，甚至发布之初一度以技术安全考虑为由拒绝开源 GPT-2 模型。聊天机器人(Chatbot) 聊天机器人也是自然语言处理的一项主流任务，机器自动学习与人类对话，对于人类的简单诉求提供满意的自动回复，提高客户的服务效率和服务质量等。常应用在咨询系统、娱乐系统、智能家居等中。预览版202112 第 1 章人工智能绪论 12 1.4.3 强化学习虚拟游戏相对于真实环境，虚拟游预览版202112 1.5 深度学习框架 13 是一个基于 Python 语言、定位底层运算的计算库，Theano 同时支持 GPU 和 CPU 运算。由于 Theano 开发效率较低，模型编译时间较长，同时开发人员转投 TensorFlow 等原因，Theano 目前已经停止维护。 ❑ Scikit-learn 是一个完整的面向机器学习算法的计算库，内建了常见的传统机器学习算 TensorFlow 等框架提供的底层运算而实现的高层框架，提供了大量快速训练、测试网络的高层接口。对于常见应用来说，使用 Keras 开发效率非常高。但是由于没有底层实现，需要对底层框架进行抽象，运行效率不高，灵活性一般。 ❑ TensorFlow 是 Google 于 2015 年发布的深度学习框架，最初版本只支持符号式编程。得益于发布时间较早，以及 Google 在深度学习领域的影响力，TensorFlow

0 码力 | 439 页 | 29.91 MB | 1 年前
3
动手学深度学习 v2.0

194 iv 5.1.3 在前向传播函数中执行代码 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 5.1.4 效率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 5.2 参数管理中，我们介绍了一类新的模型，它采用了一种称为注意力机制的技术，最近它们已经开始在自然语言处理中取代循环神经网络。这一部分将帮助读者快速了解大多数现代深度学习应用背后的基本工具。 • 第三部分讨论可伸缩性、效率和应用程序。首先，在 11节中，我们讨论了用于训练深度学习模型的几种常用优化算法。下一章 12节将探讨影响深度学习代码计算性能的几个关键因素。在 13节中，我们展示了深度学习在计算机视觉中的主要应用。在（社交网络） 100 GB 1 PF (Nvidia DGX‐2) 很明显，随机存取存储器没有跟上数据增长的步伐。与此同时，算力的增长速度已经超过了现有数据的增长速度。这意味着统计模型需要提高内存效率（这通常是通过添加非线性来实现的），同时由于计算预算的增加，能够花费更多时间来优化这些参数。因此，机器学习和统计的关注点从（广义的）线性模型和核方法转移到了深度神经网络。这也造就了许多深度学习的中流砥柱，如多层感知机

0 码力 | 797 页 | 29.45 MB | 1 年前
3
微博在线机器学习和深度学习实践-黄波

FM：大规模稀疏数据下的特征组合问题 • DeepFM • 优化算法选择 • FTRL：调节学习率，突出低频特征，非batch优化 • Adagrad : 调节学习率，突出低频特征，实现简单 • SGD：参数少，效率高，固定学习率 • ID特征处理 • Hash：BKDRhash/CityHash，ID高维度稀疏+实时 3 在线机器学习-实时模型训练 serving serving server server System Model Serving System 3 在线机器学习-参数服务器 • 参数规模 • 支持百亿特征维度，千亿参数 • 模型版本 • 多模型多版本：多组实验并行执行，提高实验迭代效率 • 在线版本切换：基于ZK的版本感知机制，动态进行版本切换，实现BASE模型的热更新，实时训练与离线训练周期模型融合 • 模型结构训练与推理兼容：在线PS与离线PS模型结构兼容，自动模型参数转换效果提升主要来源于Deep部分高阶特征组合 • 但同时对模型服务的性能要求更高 4 深度学习-效果平台篇 PLATFORM 平台背景、平台架构和平台效果 12 • 平台背景-平台化成本效率效果实时机器人力时间开发运行迭代规模深度 1 平台背景算法/模型计算数据/特征存储基础/IDE 业务调度集群 2 平台架构计算

0 码力 | 36 页 | 16.69 MB | 1 年前
3
PyTorch OpenVINO 开发实战系列教程第一篇

pytorch 发布之后两年的 2018 年 facebook 又把 caffe2 项目整合到 pytorch 框架中，这样 pytorch 就进一步整合原来 caffe 开发者生态社区，因为其开发效率高、特别容易构建各种复杂的深度学习模型网络，因此很快得到大量人工智能开发者的认可与追捧，也成为工业界最受欢迎的深度学习框架之一。 Pytorch 发展至今，其版本跟功能几经迭代，针对不同的场景是深度学习框架的后起之秀，它参考了市场上早期框架包括 torch、caffe、tensorflow 的经验教训，从一开始设 PyTorch + OpenVINO 开发实战系列教程第一篇 3 计就特别注重开发者体验与生产效率提升，一经发布就引发追捧热潮，可以说“出道即巅峰”。Pytorch 虽然来自脸书实验室，但是它也吸引外部公司包括特斯拉、优步、亚马逊、微软、阿里等积极支持，其平缓的学习曲线，简洁方便的函数与模型构流图。根据构建计算图的方式不同还可以分为静态图与动态图， Pytorch 默认是基于动态图的方式构建计算图，动态图采用类似 python 语法，可以随时运行，灵活修改调整；而静态图则是效率优先，但是在图构建完成之前无法直接运行。可以看出动态图更加趋向于开发者平时接触的面向对象的编程方式，也更容易被开发者理解与接受。下图是一个简单的计算图示例：图 1-4（计算图示意）图

0 码力 | 13 页 | 5.99 MB | 1 年前
3
搜狗深度学习技术在广告推荐领域的应用

并行化训练诉求  加大数据量，提升模型稳定性  加大数据量，提升模型收益方案  MxNet支持多机多卡, 使用成本低  构建多机多卡 GPU集群，优化训练效率，提高加速比现状和计划现状  已经实现LR+DNN融合模型的上线，收益较好  受限于线上计算资源，模型复杂度有限  线下训练流程有依赖，繁琐易出错计划  线上服务拆分容易获取的海量训练数据 1 CTR预估特征有明确含义场景相关，以用户为导向很难界定“Ground Truth” 训练样本“有限” 2 方向特定业务场景模型融合提升效率，降低成本 3

0 码力 | 22 页 | 1.60 MB | 1 年前
3

共 26 条前往

页

分类

语言

格式

QCon北京2018-《深度学习在微博信息流排序的应用》-刘博

QCon北京2018-《未来都市--智慧城市与基于深度学习的机器视觉》-陈宇恒

机器学习课程-温州大学-13深度学习-Transformer

机器学习课程-温州大学-01深度学习-引言

深度学习在电子商务中的应用

【PyTorch深度学习-龙龙老师】-测试版202112

动手学深度学习 v2.0

微博在线机器学习和深度学习实践-黄波

PyTorch OpenVINO 开发实战系列教程第一篇

搜狗深度学习技术在广告推荐领域的应用