《TensorFlow 2项目进阶实战》4-商品检测篇:使用RetinaNet瞄准你的货架商品
商品检测篇:使用 RetinaNet 瞄准你的货架商品 扫码试看/订阅 《 TensorFlow 2项目进阶实战》视频课程 • 基础:目标检测问题定义与说明 • 基础:R-CNN系列二阶段模型综述 • 基础:YOLO系列一阶段模型概述 • 基础:RetinaNet 与 Facol Loss 带来了什么 • 应用:检测数据准备与标注 • 应用:划分检测训练集与测试集 • 应用:生成CSV 应用:生成CSV 格式数据集与标注 • 应用:使用 TensorFlow 2 训练 RetinaNet • 应用:使用 RetinaNet 检测货架商品 • 扩展:目标检测常用数据集综述 • 扩展:目标检测更多应用场景介绍 目录 基础:目标检测问题定义与说明 目标检测问题 目标检测评估:Ground Truth 目标检测评估: Intersection over Union (IoU) 应用:RetinaNet 与 Facol Loss 带来了什 么 RCNN系列与YOLO系列各自不足 准 慢 快 偏 RCNN系列与YOLO系列各自不足 准 慢 快 偏 正负样本不平衡 RetinaNet 提出了什么好想法? RetinaNet 提出了什么好想法? Focal Loss 解决类不平衡问题 Focal Loss 最终形式 RetinaNet 准确率与性能对比0 码力 | 67 页 | 21.59 MB | 1 年前3《TensorFlow 2项目进阶实战》6-业务落地篇:实现货架洞察Web应⽤
AI SaaS • 交付 AI SaaS:10 分钟快速掌握容器部署 • 交付 AI SaaS:部署和测试 AI SaaS 目录 串联 AI 流程理论:商品检测与商品识别 检测模型 RetinaNet 前向转换和使用 加载检测推理模型 detector 查看分类器 classifier 网络结构 串联 AI 流程实战:商品检测与商品识别 “Hello TensorFlow” Try0 码力 | 54 页 | 6.30 MB | 1 年前32020美团技术年货 算法篇
Face R-CNN[9] 、ScaleFace[10]、FDNet[11]。最后一类单阶段 的人脸检测方法主要基于 Anchor 的分类和回归,通常会在经典框架(如 SSD[12]、 RetinaNet[13])的基础上进行优化,其检测速度较两阶段法快,检测性能较级联法优, 是一种检测性能和速度平衡的算法,也是当前人脸检测算法优化的主流方向。 三、 优化思路和业务应用 在自然场景应用中 ● 检测框架 近年来单阶段人脸检测框架取得了重要的发展,代表性的结构有 S3FD[17] 中使用的 292 > 美团 2020 技术年货 SSD,SFDet[25] 中使用的 RetinaNet,SRN[23] 中使用的两步结构(后简称 SRN) 以及 DSFD[24] 中使用的双重结构(后简称 DSFD),如下图 2 所示。其中,SRN 是一种单阶段两步人脸检测方法,利用第一步的检测结果,在小尺度人脸上过滤易 1x1,Stride 为 2 的下采样模块替换 为 Stride 为 2 的 Avgpool 模块。 296 > 美团 2020 技术年货 表 2 不同主干网络在 ImageNet 的性能对比和其在 RetinaNet 框架下的检测精度 ● 预测模块 利用上下文信息可以进一步提高模型的检测性能。SSH[36] 是将上下文信息用于单阶 段人脸检测模型的早期方案,PyramidBox、SRN、DSFD0 码力 | 317 页 | 16.57 MB | 1 年前3【PyTorch深度学习-龙龙老师】-测试版202112
常用边界框(Bounding box)表示,并分类出边界框中物体的类别信息,如图 1.15 所示。常 见的目标检测算法有 RCNN、Fast RCNN、Faster RCNN、Mask RCNN、SSD、YOLO、 RetinaNet 系列等。 语义分割(Semantic Segmentation) 是通过算法自动分割并识别出图片中的内容,可以 将语义分割理解为像素点的分类问题,分析每个像素点的物体的类别信息,如图 1 AlexNet、VGG、GoogLeNet、ResNet、DenseNet、EfficientNet 等,用于目标检测的 R-CNN、Fast RCNN、Faster RCNN、Mask RCNN、YOLO、 RetinaNet、CenterNet 等。我们将在第 10 章详细介绍卷积神经网络原理。 6.7.2 循环神经网络 除了具有空间结构的图片、视频等数据外,序列信号也是非常常见的一种数据类型, 其中一0 码力 | 439 页 | 29.91 MB | 1 年前32022年美团技术年货 合辑
模型做主干网分别使用 FPN 和 Upernet 后 端,相比 PVT 和 Swin 也达到了更好结果,见下表 2: 348 > 2022年美团技术年货 表 2 ADE20K 分割 COCO 目标检测(RetinaNet 框架) 在经典的 COCO 目标检测任务中,使用 Retina 框架,Twins 模型大幅优于 PVT。 而且 Twins-PCPVT 系列证明 PVT 在通过 CPVT 的编码方式增强之后,可以媲美0 码力 | 1356 页 | 45.90 MB | 1 年前3
共 5 条
- 1