《TensorFlow 2项目进阶实战》4-商品检测篇:使用RetinaNet瞄准你的货架商品商品检测篇:使用 RetinaNet 瞄准你的货架商品 ## ☐ ☐ ☐ ☐ 扫码试看/订阅 《 TensorFlow 2 项目进阶实战》视频课程 ## 目录 - 基础:目标检测问题定义与说明 - 基础:R-CNN系列二阶段模型综述 - 基础:YOLO系列一阶段模型概述 - 基础:RetinaNet 与 Facol Loss 带来了什么 - 应用:检测数据准备与标注 - 应用:划分检测训练集与测试集 应用:划分检测训练集与测试集 - 应用:生成 CSV 格式数据集与标注 - 应用:使用 TensorFlow 2 训练 RetinaNet - 应用:使用 RetinaNet 检测货架商品 - 扩展:目标检测常用数据集综述 - 扩展:目标检测更多应用场景介绍 ## 基础:目标检测问题定义与说明 ## 目标检测问题 图像分类 : # 过滤小于0.5检测框 if score < 0.5: break # 分类框颜色(复用RetinaNet可视化模块,颜色类别可能不够用) color = label_color(label) b = box.astype(int) # 检测框中的SKU小图 cropped = draw[b[1]:b[3] zip(boxes[0], scores[0], labels[0]): # 过滤小于0.5检测框 if score < 0.5: break # 分类框颜色(复用RetinaNet可视化模块,颜色类别可能不够用) color = label_color(label) b = box.astype(int) # 检测框中的SKU小图 cropped = draw[b[1]:b[3]0 码力 | 54 页 | 6.30 MB | 2 年前3
2020美团技术年货 算法篇、ScaleFace $ ^{[10]} $ 、FDNet $ ^{[11]} $ 。最后一类单阶段的人脸检测方法主要基于 Anchor 的分类和回归,通常会在经典框架(如 SSD $ ^{[12]} $ 、RetinaNet $ ^{[13]} $ )的基础上进行优化,其检测速度较两阶段法快,检测性能较级联法优,是一种检测性能和速度平衡的算法,也是当前人脸检测算法优化的主流方向。 ## 三、 优化思路和业务应用 心。 ## · 检测框架 近年来单阶段人脸检测框架取得了重要的发展,代表性的结构有 S3FD $ ^{[17]} $ 中使用的 SSD,SFDet $ ^{[25]} $ 中使用的 RetinaNet,SRN $ ^{[23]} $ 中使用的两步结构(后简称 SRN)以及 DSFD $ ^{[24]} $ 中使用的双重结构(后简称 DSFD),如下图 2 所示。其中,SRN 是一种单阶 p296_1.jpg) 图 2 四种检测结构 |检测结构|Easy|Medium|Hard| |---|---|---|---| |SSD|0.937|0.922|0.818| |RetinaNet|0.950|0.941|0.880| |DSFD|0.953|0.944|0.886| |SRN|0.964|0.953|0.902| 表 1 Backbone 为 ResNet50 时,四种检测结构在0 码力 | 317 页 | 16.57 MB | 2 年前3
【PyTorch深度学习-龙龙老师】-测试版202112ing box)表示,并分类出边界框中物体的类别信息,如图 1.15 所示。常见的目标检测算法有 RCNN、Fast RCNN、Faster RCNN、Mask RCNN、SSD、YOLO、RetinaNet 系列等。 语义分割(Semantic Segmentation) 是通过算法自动分割并识别出图片中的内容,可以将语义分割理解为像素点的分类问题,分析每个像素点的物体的类别信息,如图 1.16 AlexNet、VGG、GoogLeNet、ResNet、DenseNet、EfficientNet 等,用于目标检测的 R-CNN、Fast RCNN、Faster RCNN、Mask RCNN、YOLO、RetinaNet、CenterNet 等。我们将在第 10 章详细介绍卷积神经网络原理。 #### 6.7.2 循环神经网络 除了具有空间结构的图片、视频等数据外,序列信号也是非常常见的一种数据类型,其中0 码力 | 439 页 | 29.91 MB | 2 年前3
2022年美团技术年货 合辑6/50.348.6/50.3 48.6/50.3 表 2 ADE20K 分割 ## COCO 目标检测(RetinaNet 框架) 在经典的 COCO 目标检测任务中,使用 Retina 框架,Twins 模型大幅优于 PVT。而且 Twins-PCPVT 系列证明 PVT 在通过 CPVT 的编码方式增强之后,可以媲美 的编码方式增强之后,可以媲美 Swin 同量级模型,见下表 3: Table 3 – Object detection performance on the COCO val2017 split using the RetinaNet framework. 1× is 12 epochs and 3× is 36 epochs. "MS": Multi-scale training. FLOPs are evaluatedFLOPsParam(G) (M) RetinaNet 1× RetinaNet 3× + MS AP AP50 AP75 AP50 ResNet50 0 码力 | 1356 页 | 45.90 MB | 2 年前3共 5 条- 1













