以下链接是个人关于mmdetection(Foveabox-目标检测框架)所有见解,如有错误欢迎大家指出,我会第一时间纠正。有兴趣的朋友可以加微信:a944284742相互讨论技术。若是帮助到了你什么,一定要记得点赞!因为这是对我最大的鼓励。
目标检测00-00:mmdetection(Foveabox为例)-目录-史上最新无死角讲解
FoveaBox:BeyoundAnchorBasedObjectDetection\color{red}{本论文名为:FoveaBox: Beyound Anchor-Based Object Detection}

4.Experiments

我们的实验是基于 MS COCO 以及 Pascal VOC 两个基线数据集。对于 COCO 数据,训练集为 trainval35k。如果没有特别指出,默认使用 ResNet-50-FPN 骨干和600像素的训练和测试图像来进行消融研究。我们主要的结果,报告了在 COCO AP test-dev 数据集上的 COCO AP ,它没有公共标签,需要使用评估服务器。对于Pascal VOC,所有模型都在trainval2007和trainval2012上进行训练,并按照惯例在test2007子集上进行评估。

A. Main Results
   Foveabox 和目标最先进算法比较的结果如下Table I:
目标检测00-06:mmdetection(Foveabox为例)-白话给你讲论文-翻译无死角-2
其中的第一组为 2 阶段的模型,第二组为一阶段的模型,第三组为我们提出的Foveabox。 可以看我们的所有模型变体都超过了之前的模型的结果。

B. Ablation Study
1.Qualitative Results: 如下Fig.5展示了我们网络输出的结果(上片博客有图解):
目标检测00-06:mmdetection(Foveabox为例)-白话给你讲论文-翻译无死角-2
点和 box 概率大于 0.5 进行显示(没有经过 NMS 处理)。对于每个对象,虽然有几个活动点(大于0.5的概率值)。但是他们都是和 ground truth 十分接近的。所以其能证明 Foveabox 能够能够不需要候选框直接生成准确,鲁棒性好的 目标边界框。

2.Various Anchor Densities and FoveaBox : 基于 anchor 实现的算法,如何去密集的覆盖可能存在目标的所有空间。基于 anchor 的方式使用一个固定的采样网格,在每个空间位置使用多个 anchor 点是一种流行的方法来实现目标的高覆盖率,我们在每个位置上附加更密集的 anchor 时,我们总是可以得到更好的性能。为了验证这一假设,我们对RetinaNet中每个空间位置和每个金字塔级别使用的尺度和宽高比 anchor 的数量进行了扫描。这样对于每个位置,其 anchor 的数量变成了 12 个。超过了之前的 6~9 个。实验结果如下表格 Table II 所示:
目标检测00-06:mmdetection(Foveabox为例)-白话给你讲论文-翻译无死角-2
可以看到 anchor 也会出现饱和的现象,也就是达到一定极限之后,增加 anchor 数目很难提高网络的性能。
   过密的 anchor 不仅增加了前-背景优化的难度,而且还可能造成定位模糊的界定问题。对于每个输出空间位置,都有一个锚,锚的标签由带有ground-truth的IoU定义,些锚被定义为阳性样本,其他的为负样本。但是,它们共享相同的输入特性。分类器不仅需要区分不同位置的样本,还需要区分同一位置的不同 anchor。
   相比之下,FoveaBox明确地预测了每个位置的一个目标,并且不比基于锚的最佳模型的性能差。相比于基于 anchor 的算法,我们的模型有如下优势:
1.