开源平台 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

构建基于富媒体大数据的弹性深度学习计算平台

构建基于富媒体大数据的弹性深度学习计算平台 SPEAKER / 土土@七牛 AtLab Mobile —> 富媒体时代数据存储数据加速数据处理直播点播 Connect 每天超过10亿图像上传超过万亿小时的音视频存储 What are they？内容审核团队运营分析团队 AI？ Content 分类检测分割跟踪描述搜索分析 … 描述：事件1-XXXX 事件2-XXXX 人物出现:id1, id2 场景二 … 用户行为用户数据推理结果推理服务数据抽样和整理样本训练模型模型评估 AVA深度学习平台 Caching IO Distributed System Docker Orchestration Storage HDFS SQL NoSQL Caffe MXNet Tensorflow

0 码力 | 21 页 | 1.71 MB | 1 年前
3
阿里云上深度学习建模实践-程孟力

阿里云深度学习实践程孟力花名: 杨熙阿里巴巴-计算平台-PAI 个性化推荐视频理解智能对话系统图像检索更多场景  OCR识别  人脸核身  智能风控  自动驾驶  语音助手 • • • 优势: 效果显著超越传统模型(线性层模型 / 树模型 / SVM模型 / … ) 深度学习应用场景沙漠湖泊旅行深度学习应用主要的挑战： 2.模型效果优化困难 MapReduce Blink  场景丰富: 图像/视频/推荐/搜索  大数据+大模型: Model Zoo  跨场景+跨模态  开箱即用: 封装复杂性  白盒化, 可扩展性强  积极对接开源系统+模型 FTRL SGD Adam Solutions Librarys 优势: Components Framework EasyVision EasyRec GraphLearn SDK/API  多语言、国际化  多种证件版式  准确率领先同类产品  集成方便标准化: Standard Solutions 智能推荐解决方案: 推荐请求 PAI-Studio–建模平台召回模型 EasyRec GraphLearn Alink 排序模型模型训练评估 PAI-EAS – 模型推理 model1 model2 … PAI-ABTest

0 码力 | 40 页 | 8.51 MB | 1 年前
3
谭国富：深度学习在图像审核的应用

深度学习在图像审核的应用腾讯优图实验室谭国富 http://open.youtu.qq.com SACC2017 优图团队立足于社交网络大平台，借助社交业务积累的海量人脸、图片、音乐等数据，专注在人脸、图像、音乐、语音、机器学习等领域开展技术研究，并积极推动研究成果在业务中落地产生价值。关于优图实验室人脸识别图像识别音频识别 SACC2017 目录 01 腾讯优图内容审核能力介绍直播行业的快速兴起，使得视频中不良信息含量更加迅猛增长，色情暴力等不雅视频频繁流出，导致各网络直播平台面临危机。 Ø 内容监管日趋严格， 2017年上半年，各大直播行业协会相应成立，行业平台自我规范的同时，网信办、文化部等国家部门对于直播行业监管也越发严格，几乎所有知名的直播平台均被有关部门点名查处过，特别2017 年月中旬，黄鳝事件引爆网络，让色情直播再度被推上舆论浪尖。完备节约成本节省审核人力减少人工漏审技术诉求：自动识别图片或视频中出现的文字、二维码、logo等内容以及违规人像、淫秽、血腥、暴力、极端主义、恐怖主义图像等，方便平台进行违规处理和风险管控。业务痛点：面对越来越爆发的安全风险，解决办法门槛高，成本高；迫切需要技术解决方案 SACC2017 图像内容审核技术 OCR技术图像分割以及超分辨率技术

0 码力 | 32 页 | 5.17 MB | 1 年前
3
超大规模深度学习在美团的应用-余建平

超大规模深度学习在美团的应用余建平美团点评用户平台研究员自我介绍自我介绍 2011年硕士毕业于南京大学计算机科学与技术系。毕业后曾在百度凤巢从事机器学习工程相关的工作，加入美团后，负责超大规模机器学习系统，从无到有搭建起支持千亿级别规模的深度学习系统，与推荐、搜索、广告业务深度合作，在算法上提供从召回到排序的全系统优化方案，在工程上提供离线、近线、在线的全流程解决方案。。目录 • 美团超大规模模型场景简介 • 超大规模机器学习MLX  MLX平台目标  MLX平台架构 • 模型场景应用  召回模型  排序模型目录 • 美团超大规模模型场景简介 • 超大规模机器学习MLX  MLX平台目标  MLX平台架构 • 模型场景应用  召回模型  排序模型美团超大规模模型应用场景美团推荐美团搜索美团广告美团应用场景简介 LBS相关的推荐 • 模型特点 百亿级别的训练数据 千亿级别的模型特征 秒级实时的模型反馈目录 • 美团超大规模模型场景简介 • 超大规模机器学习MLX  MLX平台目标  MLX平台架构 • 模型场景应用  召回模型  排序模型超大规模模型的有效性 • VC维理论  描述模型的学习能力：VC维越大模型越复杂，学习能力越强  机器学习能力 = 数据

0 码力 | 41 页 | 5.96 MB | 1 年前
3
QCon北京2018-《未来都市--智慧城市与基于深度学习的机器视觉》-陈宇恒

• 智慧城市中机器视觉应用 • 我们是如何构建城市级AI+智慧城市系统 • 大规模深度学习实战系统的几点经验 l商汤科技联合创始人，架构师 lC++/Go/Rust/Ruby开发者 l多个开源项目贡献者 lNIPS国际会议论文作者 @chyh1990 2017.6 2016.3 2015.11 2014.6 2013.3 2011年中 2017.3 2016.3 2014 人工智能博士唯一深度学习平台公司累计融资全球最大核心技术全球领先商业营收市占率行业第一 400余家大型客户伙伴共同发展 AI+金融 AI+智慧城市 AI+芯片 AI+无人驾驶 AI+智能手机 AI+医疗图像 AI+智慧城市：以智能安防场景为例特征向量 AI+智慧城市 2015-2017 l单机、简易分布式人脸检测、跟踪、比对平台 l处理数十路到数百路监控摄像头数据 Billion级别深度学习特征检索 - PB以上级别数据库存储 - 100PB级别抓拍图片存储 - 每秒万次并发检索请求 l大规模推广应用 l某种程度上说，城市内所有市民都是系统的用户深度学习算法发展为平台系统赋能首次超过人眼 2014 2015 98.52% 97.35% 97.45% 人眼 DeepID时代 99.55% 99.15% 30万张人脸训练 DeepID3 DeepID2

0 码力 | 23 页 | 9.26 MB | 1 年前
3
《TensorFlow 快速入门与实战》4-实战TensorFlow房价预测

TensorFlow 训练模型的工作流数据读入数据分析数据规范化创建模型 (数据流图) 创建会话 (运行环境) 训练模型数据分析库：Pandas Pandas 是一个 BSD 开源协议许可的，面向 Python 用户的高性能和易于上手的数据结构化和数据分析工具。数据框（Data Frame）是一个二维带标记的数据结构，每列（column）数据类型可以不同。我们可以将其当作电子表格或数据库表。数据可视化库：matplotlib & seaborn & mplot3d matplotlib 是一个 Python 2D 绘图库，可以生成出版物质量级别的图像和各种硬拷贝格式，并广泛支持多种平台，如：Python 脚本，Python，IPython Shell 和 Jupyter Notebook。 seaborn 是一个基于 matplotlib的 Python 数据可视化库。它提供了更易用的高级接口，用方法专门用于线性关系的可视化，适用于回归模型。数据分析（3D） Axes3D.scatter3D 方法专门用于绘制3维的散点图。数据归一化（3D）数据处理：NumPy NumPy 是一个 BSD 开源协议许可的，面向 Python 用户的基础科学计算库，在多维数组上实现了线性代数、傅立叶变换和其他丰富的函数运算。 X y 创建线性回归模型（数据流图）创建会话（运行环境）使用 TensorBoard

0 码力 | 46 页 | 5.71 MB | 1 年前
3
【PyTorch深度学习-龙龙老师】-测试版202112

进行二次撰写，代码部分完全基于 PyTorch 进行实现。考虑到本人能力有限、行文仓促，可以预见地，本书会存在部分语句表达不准确、部分素材尚未创作完成、部分参考引用未能及时补充、甚至一些错误出现，因此本书以开源、免费地方式发布，希望一方面能够帮助初学者快速上手深度学习算法，另一方面也能汇聚众多行业专家们的力量，修正测试版中的谬误之处，让本书变得更为完善。本书虽然免费开放电子版，供个人学习使用，但是未经许可，不能用于任何个人或者企年，DeepMind 公司应用深度神经网络到强化学习领域，提出了 DQN 算法，在 Atari 游戏平台中的 49 个游戏上取得了与人类相当甚至超越人类的水平；在围棋领域，DeepMind 提出的 AlphaGo 和 AlphaGo Zero 智能程序相继打败人类顶级围棋专家李世石、柯洁等；在多智能体协作的 Dota2 游戏平台，OpenAI 开发的 OpenAI Five 智能程序在受限游戏环境中打败了 TI8 到端地训练，获得的模型性能好，适应性强；在 Atria 游戏平台上，DeepMind 设计的 DQN 算法模型可以在相同的算法、模型结构和超参数的设定下，在 49 个游戏上获得人类相当的游戏水平，呈现出一定程度的通用智能。图 1.14 是 DQN 算法的网络结构，它并不是针对于某个游戏而设计的，而是可以控制 Atria 游戏平台上的 49 个游戏。图 1.14 DQN 算法网络结构示意图

0 码力 | 439 页 | 29.91 MB | 1 年前
3
PyTorch OpenVINO 开发实战系列教程第一篇

开发者的欢迎。其模型训练支持CPU与GPU、支持分布式训练、云部署、针对深度学习特定领域有不同的丰富的扩展库。 1.1.1 Pytorch 历史 Pytorch 在 2016 年由 facebook 发布的开源机器学习（深度学习）框架，Pytorch 最初的来源历史可以追溯到另外两个机器学习框架，第一个是 torch 框架，第二个是 Chainer，实现了 Eager 模式与自动微分，Pytoch Pytorch 的开发环境搭建十分的简洁，它的依赖只有 Python 语言 SDK，只要有了 Python 语言包支持，无论是在 windows 平台、ubuntu 平台还是 Mac 平台都靠一条命令行就可以完成安装。首先是安装 Python 语言包支持，当前 Pytorch 支持的 Python 语言版本与系统对应列表如下：表 -1（参考 Pytorch

0 码力 | 13 页 | 5.99 MB | 1 年前
3
Keras: 基于 Python 的深度学习库

及的次数位居第二。Keras 还被大型科学组织的研究人员采用，特别是 CERN 和 NASA。 2.3 Keras 可以轻松将模型转化为产品与任何其他深度学习框架相比，你的 Keras 模型可以轻松部署在更广泛的平台上： • 在 iOS 上，通过 Apple’s CoreML（苹果为 Keras 提供官方支持）。这里有一个教程。 • 在安卓上，通过 TensorFlow Android runtime，例如：Not TensorFlow 后端 • 微软的 CNTK 后端 • Theano 后端亚马逊也正在为 Keras 开发 MXNet 后端。如此一来，你的 Keras 模型可以在 CPU 之外的不同硬件平台上训练： • NVIDIA GPU。 • Google TPU，通过 TensorFlow 后端和 Google Cloud。 • OpenGL 支持的 GPU, 比如 AMD, 通过 PlaidML TensorFlow 后端，Theano 后端，CNTK 后端。 • TensorFlow 是由 Google 开发的一个开源符号级张量操作框架。 • Theano 是由蒙特利尔大学的 LISA Lab 开发的一个开源符号级张量操作框架。 • CNTK 是由微软开发的一个深度学习开源工具包。将来，我们可能会添加更多后端选项。 14.2 从一个后端切换到另一个后端如果您至少运行过一次 Keras，您将在以下位置找到

0 码力 | 257 页 | 1.19 MB | 1 年前
3
动手学深度学习 v2.0

matplotlib_inline import backend_inline d2l = sys.modules[__name__] 本书中的大部分代码都是基于PyTorch的。PyTorch是一个开源的深度学习框架，在研究界非常受欢迎。本书中的所有代码都在最新版本的PyTorch下通过了测试。但是，由于深度学习的快速发展，一些在印刷版中代码可能在PyTorch的未来版本无法正常工作。但是 ine learning，ML）是一类强大的可以从经验中学习的技术。通常采用观测数据或与环境交互的形式，机器学习算法会积累更多的经验，其性能 17 也会逐步提高。相反，对于刚刚所说的电子商务平台，如果它一直执行相同的业务逻辑，无论积累多少经验，都不会自动提高，除非开发人员认识到问题并更新软件。本书将带读者开启机器学习之旅，并特别关注深度学习（deep learning，DL）的基础的快速进步。尽管在许多情况下，这是以修改和重新发明存在了数十年的工具为代价的。最后，深度学习社区引以为豪的是，他们跨越学术界和企业界共享工具，发布了许多优秀的算法库、统计模型和经过训练的开源神经网络。正是本着这种精神，本书免费分发和使用。我们努力降低每个人了解深度学习的门槛，希望读者能从中受益。 1.7. 特点 37 小结 • 机器学习研究计算机系统如何利用经验（通常是数据）

0 码力 | 797 页 | 29.45 MB | 1 年前
3

共 31 条前往

页

分类

语言

格式