机器学习课程-温州大学-01深度学习-引言2011年 D轮融资 估值40亿美元 8 科大讯飞 智能语音技术 综合 中国 1999年 上市 市值108亿美元 9 Automation Anywhere 自然语言处理技术、非结构化数据认知 企业管理 美国 2003年 B轮融资 估值68亿美元 10 IBM Watson(IBM沃森) 深度学习、智适应学习技术 计算机 美国 1911年 上市 市值1198亿美元 11 松鼠AI 1对1 智适应学习技术、机器学习 自动驾驶汽车需要计算机视觉。特斯拉 (Tesla)、宝马(BMW)、沃尔沃(Volvo)和奥迪 (Audi)等汽车制造商Y已经通过摄像头、激光 雷达、雷达和超声波传感器从环境中获取图 像,研发自动驾驶汽车来探测目标、车道标 志和交通信号,从而安全驾驶。 安防 中国在使用人脸识别技术方面无疑处于领先地 位,这项技术被广泛应用于警察工作、支付识 别、机场安检,甚至在北京天坛公园分发厕0 码力 | 80 页 | 5.38 MB | 1 年前3
QCon北京2018-《深度学习在微博信息流排序的应用》-刘博深度学习在微博Feed流应用实践 刘博 新浪微博机器学习研发部关系流算法负责人 1 2 3 深度学习应用与实践 常规CTR方法排序 微博Feed流排序场景介绍 目录 微博Feed流产品介绍—排序场景 Ø 信息获取方式 • 主动获取(关注) Ø 内容形式 • 博文/文章/图片/视频/问答/话题/… • 被动获取(推荐) Ø 微博—社交媒体领跑者 • DAU:1.72亿,MAU:30 码力 | 21 页 | 2.14 MB | 1 年前3
QCon北京2018-《未来都市--智慧城市与基于深度学习的机器视觉》-陈宇恒识别大幅提升精度 软银孙正义设立1000亿美元人 工智能基金,320亿美元收购芯 片架构公司ARM 2016.7 公司简介 历史业绩 领先技术 20年 科研经验 800余位 技术研发人员 150余位 人工智能博士 唯一 深度学习 平台公司 累计融资 全球最大 核心技术 全球领先 商业营收 市占率 行业第一 400余家 大型客户伙伴 共同发展 AI+金融 AI+智慧城市0 码力 | 23 页 | 9.26 MB | 1 年前3
深度学习在电子商务中的应用实验室。 4 程进兴,苏宁美国研究院技术总监,斯坦福大学 博士,清华大学本科。 曾在甲骨文,雅虎,微软, 沃尔玛实验室等多家公司从事搜索,广告,大数 据分析,机器学习,人工智能应用等方面的研发 工作。在此期间,发表了10多篇相关领域的研究 论文,并有10多项相关领域的专利。 业余爱好: 骑行 个人简介 电子邮箱: jim.cheng@ususing.com 5 议程 • 深度学习与商品搜索0 码力 | 27 页 | 1.98 MB | 1 年前3
机器学习课程-温州大学-13深度学习-Transformeroder部分 并不需要标签,有语料就能训练了 4.BERT Encoder BERT是一个算法模型,它的出现打破了大量的自然语言处 理任务的记录。在BERT的论文发布不久后,Google的研发 团队还开放了该模型的代码,并提供了一些在大量数据集 上预训练好的算法模型下载方式,这使得所有人都可以通 过它来构建一个涉及NLP的算法模型,节约了大量训练语 言模型所需的时间,精力,知识和资源0 码力 | 60 页 | 3.51 MB | 1 年前3
TensorFlow on Yarn:深度学习遇上大数据没有GPUs集群资源管理和调度(内存、CPU、GPU、 端⼝),集群资源负载不均� • 训练数据⼿动分发,训练模型⼿动保存� • 进程遗留问题,需要⼿动杀死� • 缺乏作业统⼀管理,不便对作业运⾏状态跟踪� • 日志查看不⽅便� � 总结:� TensorFlow使用现状及痛点 • 集群资源的管理(目前支持CPU、内存,需要扩展GPU 资源管理)� • 作业的统⼀管理、状态跟踪� Pool)的划分� • 作业进程的资源隔离� Yarn能解决什么问题:� TensorFlow on Yarn设计 • 同时支持单机和分布式TensorFlow程序� • 支持GPU资源管理和调度� • 不再需要⼿动配置CluserSpec信息,仅需要设置work 和ps的数量� • 训练数据和训练模型基于HDFS统⼀存储� • 作业训练结束自动回收work、ps和Tensorboard进程� public abstract void setGpuCores(int gCores);� � 最终在ResourceManager端需要完成:� 1、对NodeManager GPU卡数量的统计管理� 2、调度器统计管理每个Pool的GPU设备数的分配情况� � 具体可以参考下面Patch的实现思路:� https://issues.apache.org/jira/browse/YARN-5517� TensorFlow0 码力 | 32 页 | 4.06 MB | 1 年前3
《TensorFlow 2项目进阶实战》3-方案设计篇:如何设计可落地的AI解决方案TensorFlow 2项目进阶实战》视频课程 • 行业背景:AI新零售是什么? • 用户需求:线下门店业绩如何提升? • 长期⽬目标:货架数字化与业务智能化 • 短期目标:自动化陈列审核和促销管理 • 方案设计:基于深度学习的检测/分类的AI流水线 • 方案交付:支持在线识别和API调用的 AI SaaS 目录 行业背景:AI新零售是什么? 人类零售演进史 ——《C时代 新零售——阿里研究院新零售研究报告》 产品价格指数 • 促销执行统计 客户需求:棚格图推荐设计与销量预测 如何落地项目第一期? 短期目标:自动化陈列审核和促销管理 业务落地基础:货架数字化 SKU 种类 数量 位置 品类 占比 货架 设计 场景 层数 编号 业务落地:自动化陈列审核和促销管理 陈列 必分销 新品 纯度 排面 SKU 种类 数量 位置 品类 占比 货架 设计 场景 层数 Showcase AI SaaS Showcase AI 通用物品识别平台架构 品 识 AI 中 台 AI 算法库 AI 核心模块 AI 行业模型 数据集 模型训练 模型管理 AutoML AI 物品库 服务管理 模型压缩 棚格图识别 货架巡检 商品推荐 陈列审核 入库审计 货物盘点 构件识别 CAD解析 规则审查 户型图识别 视频盘点 自动分拣 细粒度识别 目标检测0 码力 | 49 页 | 12.50 MB | 1 年前3
谭国富:深度学习在图像审核的应用自建识别模型 加大审核人力 一旦出现严重违规平 台面临停业整顿风险 昂贵的专业机器、AI专家, 样本不足导致识别模型漏 过模型调优难度大 人力审核疲劳容易发 生漏过,人力招聘、 管理需要耗费不小成 本 识别种类 完备 节约成本 节省审核 人力 减少人工 漏审 技术诉求:自动识别图片或视频中出现的文 字、二维码、logo等内容以及违规人像、淫 秽、血腥、暴力、极端主义、恐怖主义图像 Job 1 Train Job 1 Val Job 2 WK Job 2 WK Job 3 监控/启停 任务调度/资源管理 监控上报 cephfs存储集 群 本地文件系统 数据 模型/日志 client 管理数据 提取模型、 查看日志 提交/管理任务 用户 docker.oa.co m 自动拉取镜像 Redis 冷数据 热任务/监控数据/集群信息 • 任务监控与自动重启 任务监控与自动重启 • 分布式多机训练,不可避免遇到由于硬件/网 络波动引起的异常 • 监控任务运行状况,当任务发生异常时,选 择不同的重启策略 • 集群管理与监控 • 节点心跳异常告警 • 运维工具化,快速屏蔽/启动异常机器 • 灵活的资源分配 • 支持以 GPU 或节点为粒度进行资源分配 • 用户配置任务所需最小资源 • 自动扩缩容,最大化资源使用率 • 支持不同计算框架 •0 码力 | 32 页 | 5.17 MB | 1 年前3
【PyTorch深度学习-龙龙老师】-测试版202112代码文件(.py 格式)。 这里选择安装集成了 Python 解释器和虚拟环境等一系列辅助功能的 Anaconda 软件, 用户通过安装 Anaconda 软件,可以同时获得 Python 解释器、包管理和虚拟环境等一系列 便捷功能,何乐而不为呢。首先从 https://www.anaconda.com/distribution/#download-section 网址进入 Anaconda 下载页面,选择 28 CUDA 安装结果测试-1 图 1.29 CUDA 安装结果测试-2 1.6.3 PyTorch 安装 PyTorch 和其他的 Python 库一样,使用 Python 包管理工具 pip install 命令即可安装。 官方推荐采用 conda install 命令安装。打开 https://pytorch.org/网页,选择 Windows 操作系 统、Conda 安装方式、Python 1 手写数字图片数据集 3 目前常用的深度学习框架,如 PyTorch (Paszke, 以及其他人, 2019)、TensorFlow 等, 都可以非常方便地通过数行代码自动下载、管理和加载 MNIST 数据集,不需要开发者额 外编写代码,使用起来非常方便。这里利用 PyTorch 附带的 torchvision 库自动在线下载 MNIST 数据集,并转换为 PyTorch 的数据对象0 码力 | 439 页 | 29.91 MB | 1 年前3
从推荐模型的基础特点看大规模推荐类深度学习系统的设计 袁镱�推荐类模型的深度学习系统设计 � 系统维度 � 算法维度 �总结 基于深度学习模型的推荐流程,场景与⽬标 Serving系统 HDFS 数据 通道 训练系统 召回 业务服务 排序 混排 模型 管理 上线 管理 ⽆量 RGW/Cos/ kafka 样本 存储 实时样本 ⽣成服务 离线样本 ⽣成任务 数据 通道 特征 处理 模型 登记 模型 上线 预测 请求 数据 落地 ⽆量 ⽤户⾏为数据上报 异步storage线程,⽀持基于冷热数据的多级存储。内存消 耗下降30%-70% 磁盘 训练 Lookup+ pooling 算⼦融合 Unique keys Storage 近期训练 参数管理 需保持顺 序,以保证 训练效果 样本读取 样本解析 基于GPU的多级存储训练:更⾼的性价⽐ � 推荐模型GPU训练的挑战 � 显存(A100最⼤80GB)放不下TB级的模型 � GPU多线程并⾏计算能⼒对稀疏数据不友好0 码力 | 22 页 | 6.76 MB | 1 年前3
共 23 条
- 1
- 2
- 3













