《TensorFlow 2项目进阶实战》5-商品识别篇:使用ResNet识别你的货架商品
应⽤用:检测SKU抠图与分类标注流程 • 应⽤用:分类训练集与验证集划分 • 应⽤用:使⽤用TensorFlow 2训练ResNet • 应⽤用:使用ResNet识别货架商品 • 扩展:图像分类常用数据集综述 • 扩展:图像分类更多应⽤用场景介绍 目录 基础:图像分类问题定义与说明 图像分类问题 语义级分类 细粒度分类 图像分类问题 实例级分类 识别问题 图像分类问题 实例级分类 TensorFlow 2 训练 ResNet “Hello TensorFlow” Try it! 应⽤用:使用ResNet识别货架商品 “Hello TensorFlow” Try it! 扩展:图像分类常用数据集综述 https://github.com/zalandoresearch/fashion-mnist http://yann.lecun.com/exdb/mnist/ MNIST edu/Image_Datasets/Caltech256/ Caltech 101 & Caltech 256 https://www.pinlandata.com/rp2k_dataset 扩展:图像分类更多应⽤用场景介绍 图像分类应用:牛脸识别与畜牧险维保 图像分类应用:户型图识别(空间、家具) 原始户型图 空间分割 (整体效果) 空间分割 (中间结果) 图像分类应用:智能相册0 码力 | 58 页 | 23.92 MB | 1 年前3《TensorFlow 2项目进阶实战》4-商品检测篇:使用RetinaNet瞄准你的货架商品
应用:划分检测训练集与测试集 • 应用:生成CSV 格式数据集与标注 • 应用:使用 TensorFlow 2 训练 RetinaNet • 应用:使用 RetinaNet 检测货架商品 • 扩展:目标检测常用数据集综述 • 扩展:目标检测更多应用场景介绍 目录 基础:目标检测问题定义与说明 目标检测问题 目标检测评估:Ground Truth 目标检测评估: Intersection over Union TensorFlow 2 训练 RetinaNet “Hello TensorFlow” Try it! 应用:使用 RetinaNet 检测货架商品 “Hello TensorFlow” Try it! 扩展:目标检测常用数据集综述 通用目标检测数据集 • The ImageNet Large Scale Visual Recognition Challenge ILSVRC • The PASCAL 21841 图像总数: 1400万+ 带有 Bounding box 的图像总数: 1,034,908 带有 SIFT 特征的识别小类: 1000 带有 SIFT 特征的图像总数: 1200万 扩展:目标检测更多应用场景介绍 目标检测应用:仓库流水审计 目标检测应用:仓库流水审计 目标检测应用:仓库盘点 无人智能盘点 人工盘点 目标检测应用:安全防护检测 目标检测应用:内容审核 目标检测应用:车流统计0 码力 | 67 页 | 21.59 MB | 1 年前3TensorFlow on Yarn:深度学习遇上大数据
进程遗留问题,需要⼿动杀死� • 缺乏作业统⼀管理,不便对作业运⾏状态跟踪� • 日志查看不⽅便� � 总结:� TensorFlow使用现状及痛点 • 集群资源的管理(目前支持CPU、内存,需要扩展GPU 资源管理)� • 作业的统⼀管理、状态跟踪� • 资源组(Schedule Pool)的划分� • 作业进程的资源隔离� Yarn能解决什么问题:� TensorFlow on Yarn设计 Web的⽅式查看作业的运⾏状况和作业日志� • 在线查看Tensorboard� • HistoryServer支持查看结束作业的日志和状态信息� • 控制已有的TensorFlow作业的迁移成本(最多改三⾏ 代码)� 扩展目标:� TensorFlow on Yarn设计 tensorflow-submit \� --app-name “tfdemo” \#作业名� --files tfTestDemo 需要知道具体GPU卡号,代码分配 计算任务到指定GPU设备 设备亲和性影响较小 设备亲和性影响较大 TensorFlow on Yarn技术细节揭秘 Yarn支持GPU调度ResourceManager端实现:� 扩展org.apache.hadoop.yarn.api.records.Resource抽象类及其实现,增加:� � public abstract int getGpuCores();� � public0 码力 | 32 页 | 4.06 MB | 1 年前3【PyTorch深度学习-龙龙老师】-测试版202112
trix Multiplication,简称 matmul)。由于 ?@?的运算结果是形状为[?, ?out]的矩阵,与向量?并不能直接相加,因此批量形式的+号 需要支持自动扩展功能(Broadcasting),将向量?扩展为形状为[?, ?out]的矩阵后,再与?@? 相加。 考虑两个样本,输入特征长度?in = 3,输出特征长度?out = 2的模型,式(3.1)展开 为: [?1 3],可以直接与?@?进行相加运算,从而获得线性层的输出张量, 这才是严格意义上的运算过程。实际上,上述插入维度和复制数据的步骤并不需要开发者 手动执行,PyTorch 会自动完成,这是下一节要介绍的自动扩展功能。 考虑另一个例子,输入张量为 2 行 2 列的矩阵,创建张量如下: In [82]: x = torch.arange(4) x = torch.reshape(x,[2,2]) 复制操作呢?这 就是接下来要介绍的 Broadcasting 操作。 4.8 Broadcasting 机制 Broadcasting 称为广播机制(或自动扩展机制),它是一种轻量级的张量复制手段,在逻 辑上扩展张量数据的形状,但是只会在需要时才会执行实际存储复制操作。对于大部分场 景,Broadcasting 机制都能通过优化手段避免实际复制数据而完成逻辑运算,从而相对于上 一节的0 码力 | 439 页 | 29.91 MB | 1 年前3亚马逊AWSAI Services Overview
MXNet 概述 MXNet • 节省以及资源效率 • 工程中廉价的GPUs、较小的内存以及网络的限制 • 速度 • 线性的扩展能力 • 简单 • 混合了声明式(declarative)和命令式()代码的特点 为什么选择 MXNet ? MXNet: 可扩展的深度学习框架 MXNet 框架的特点 命令式 NDArray API 声明式 Symbolic Executor MXNet: 要避开的面孔 • 获得人口学以及情感的数 据推荐最佳照片 • 提高在线约会匹配的推荐 • 动态的个性化广告 人脸比对 测量两张图片中同一个人的可能性 • 为应用和设备添加人脸 验证 • 扩展了物理安全控制的 应用领域 • 客人对VIP 设施的使用 • 在线考试以及民意调查 时的用户验证 人脸识别 通过针对存储的面部向量的集合找到输入面部图像的最接近 的匹配来识别图像中的人 •0 码力 | 56 页 | 4.97 MB | 1 年前3超大规模深度学习在美团的应用-余建平
• 数据 海量数据: 美团的亿级用户、千万级POI • 特征 大规模离散特征 > 小规模泛化特征 • 模型 DNN > 树模型 > LR 美团超大规模模型应用场景 • 可扩展的机器学习架构 基于Parameter Server架构 数据并行 —— 支持超大规模训练集 模型并行 —— 支持超大规模模型 • 业界千亿级以上的机器学习平台 开源: PaddlePaddle、XDL,etc Entropy、etc • 评估指标 AUC、Loss、MAE、RMSE 支持外部eval工具,计算MAP、NDCG MLX的模型能力 • 提供离线、近线、在线全流程解决方案,各阶段提供扩展方案,降低算法迭代成本; • 支持Online Learning,提供从近线到在线的模型数据通路; • 提供从召回到排序全流程的模型解决方案,为业务提供最佳实践; • 提供系统的平台化工具,为用户提供易用的界面操作; 与PS通信交换模型参数 计算图的计算 • 计算图框架Graph 计算逻辑抽象op,通过op组合形成模型结构 提供正向(forward)、反向(backward)、Loss的操作扩展 模型训练框架 • 模型可变计算路径 运行阶段 计算图裁剪 模型训练框架 • 应用场景——离线预计算 模型召回,ANN检索 粗排模型,降低线上计算量 • 分布式Sharding0 码力 | 41 页 | 5.96 MB | 1 年前3AI大模型千问 qwen 中文文档
下一步 TGW 中包含了许多更多用途,您甚至可以在其中享受角色扮演的乐趣,并使用不同类型的量化模型。您可 以训练诸如 LoRA 这样的算法,并将 Stable Diffusion 和 Whisper 等扩展功能纳入其中。赶快去探索更多高级 用法,并将它们应用于 Qwen 模型中吧! 1.7 AWQ 对于量化模型,我们推荐使用 AWQ 结合 AutoAWQ 。AWQ 即激活感知权重量化,是一种针对 LLM 通过跨区域和跨云充分利用多个资源池,以获得最佳的 GPU 可用性。 • 把费用降到最低——SkyPilot 在各区域和云平台中为您挑选最便宜的资源。无需任何托管解决方案的 额外加价。 • 将服务扩展到多个副本上,所有副本通过单一 endpoint 对外提供服务 • 所有内容均保存在您的云账户中(包括您的虚拟机和 bucket) • 完全私密 - 没有其他人能看到您的聊天记录 22 Chapter "max_tokens": 512 }' | jq -r '.choices[0].message.content' 1.11.4 使用 SkyPilot Serve 扩展服务规模 1. 使用 SkyPilot Serve 扩展 Qwen 的服务规模非常容易,只需运行: sky serve up -n qwen ./serve-72b.yaml 这将启动服务,使用多个副本部署在最经济的可用位置和加速器上。SkyServe0 码力 | 56 页 | 835.78 KB | 1 年前3动手学深度学习 v2.0
记录,并得到成熟的、维护 良好的工具的支持。关键思想应该被清楚地提炼出来,尽可能减少需要让新的从业者跟上时代的入门时间。 成熟的库应该自动化常见的任务,示例代码应该使从业者可以轻松地修改、应用和扩展常见的应用程序,以 满足他们的需求。以动态网页应用为例。尽管许多公司,如亚马逊,在20世纪90年代开发了成功的数据库驱 动网页应用程序。但在过去的10年里,这项技术在帮助创造性企业家方面的潜力已经得到了更大程度的发挥, 特定的、面向目标的方式设计、训练和部署的。虽然他们的行为可能会给人一种通用智能的错觉,但设计的 基础是规则、启发式和统计模型的结合。其次,目前还不存在能够自我改进、自我推理、能够在试图解决一 般任务的同时,修改、扩展和改进自己的架构的“人工通用智能”工具。 一个更紧迫的问题是人工智能在日常生活中的应用。卡车司机和店员完成的许多琐碎的工作很可能也将是自 动化的。农业机器人可能会降低有机农业的成本,它们也将使收割作业自动化。工业革命的这一阶段可能对 行按元素操作。在某些情况下,即使形状不同, 我们仍然可以通过调用 广播机制(broadcasting mechanism)来执行按元素操作。这种机制的工作方式如 下: 1. 通过适当复制元素来扩展一个或两个数组,以便在转换之后,两个张量具有相同的形状; 2. 对生成的数组执行按元素操作。 在大多数情况下,我们将沿着数组中长度为1的轴进行广播,如下例子: a = torch.arange(3)0 码力 | 797 页 | 29.45 MB | 1 年前3《TensorFlow 2项目进阶实战》6-业务落地篇:实现货架洞察Web应⽤
Try it! 搭建 AI SaaS 理论:Web 框架选型 Python Web 框架 Python Web 框架 - Flask Python Web 框架 - Flask Flask 常用扩展 Flask 项目常见目录结构 启动文件 manage.py 示例 搭建 AI SaaS 理论:数据库 ORM 选型 ORM 是什么 ORM 是什么 常见的 Python ORM • SQLAlchemy 分钟快速开发 AI SaaS 安装依赖 requirements.txt 安装依赖 requirements.txt 测试 flask 是否能启动 $ python manage.py 扩展启动脚本 manage.py 实现 AI 流水线 ai_pipeline.py 实现 AI 流水线 ai_pipeline.py 实现 AI 流水线 ai_pipeline.py 搭建 AI0 码力 | 54 页 | 6.30 MB | 1 年前3Keras: 基于 Python 的深度学习库
的开发重点是支持快速的实验。能够以最小的时延把你的想法转 换为实验结果,是做好研究的关键。 如果你在以下情况下需要深度学习库,请使用 Keras: • 允许简单而快速的原型设计(由于用户友好,高度模块化,可扩展性)。 • 同时支持卷积神经网络和循环神经网络,以及两者的组合。 • 在 CPU 和 GPU 上无缝运行。 查看文档,请访问 Keras.io。 Keras 兼容的 Python 版本: Python 数、正则化方法,它们都是可以结合起来构建新模型的模块。 • 易扩展性。新的模块是很容易添加的(作为新的类和函数),现有的模块已经提供了充足 的示例。由于能够轻松地创建可以提高表现力的新模块,Keras 更加适合高级研究。 • 基于 Python 实现。Keras 没有特定格式的单独配置文件。模型定义在 Python 代码中,这 些代码紧凑,易于调试,并且易于扩展。 1.3 快速开始:30 秒上手 Keras metrics=['accuracy']) 如果需要,你还可以进一步地配置你的优化器。Keras 的核心原则是使事情变得相当简单, 同时又允许用户在需要的时候能够进行完全的控制(终极的控制是源代码的易扩展性)。 model.compile(loss=keras.losses.categorical_crossentropy, optimizer=keras.optimizers.SGD(lr=00 码力 | 257 页 | 1.19 MB | 1 年前3
共 26 条
- 1
- 2
- 3