新提出的单阶段检测网络(工作后看论文的时间越来越少)
论文地址:https://arxiv.org/pdf/2008.13367.pdf
Github地址:https://github.com/hyz-xmaster/VarifocalNet
单阶段目标检测新网络-VarifocalNet | VarifocalNet: An IoU-aware Dense Object Detector

Abstract:

对大量的候选检测进行准确排序对于优异表现的目标检测器来说非常重要。然而之前的研究工作使用分类得分或者与IOU-based定位得分联合起来作为排序的依据,它们都不能可靠地表示排序,这会损害检测性能。本文中,我们提出去学习IOU感知的分类得分(IACS),可以同时表示物体的存在置信度和定位精度,以在密集的物体检测器中产生更准确的检测排序。特别是,我们设计了一个新的损失函数,称为Varifocal损失,用于训练密集的物体检测器来预测IACS,并设计了一种新的高效星形边界框特征表示,用于估算IACS和改进粗略边界框。 结合这两个新组件和边界框优化分支,我们在FCOS架构上构建了一个新的密集目标检测器,我们简称VarifocalNet或VFNet。 在MS COCO基准上进行的大量实验表明,我们的VFNet始终超过具有不同主干的强大的基准2.0 AP,并且我们的Res2Net-101-DCN最佳模型在COCO测试开发上达到了51.3的单模型单尺度AP,实现了 各种物体检测器中的最好表现。

Introduction:

目标检测中NMS需要依据候选检测目标的排序来进行筛选框,因此这个排序的可靠性就非常重要。之前的工作主要采用IOU分支(IOU-Net)与Centerness得分(FCOS)来作为大量候选检测的排序依据。

然而,本文认为这些方法可以有效缓解分类得分和物体定位精度之间的不对齐问题。 但是,它们是次优解的,因为将两个不完善的预测相乘可能会导致排名依据变差,作者经过试验表明,通过这种方法实现的性能上限非常有限。 此外,增加一个额外的网络分支来预测定位分数并不是一个很好的解决方案,并且会带来额外的计算负担。

基于上述分析,作者提出:不采用预测一个额外的定位精确度得分(IOU-aware Centerness),而是将其merge进分类得分中。即预测一个可以同时代表目标存在和定位精度的定位感知或者IOU感知的分类得分。

单阶段目标检测新网络-VarifocalNet | VarifocalNet: An IoU-aware Dense Object Detector
因此,本文做出了以下贡献
1.提出了一个可以同时表示目标存在和定位精度感知(或者IOU感知) 的分类得分IACS,试验证明了这是一个更优的候选框排序依据。

2.提出了新的Varifocal loss函数,来训练密集物体检测器使IACS回归。

3.设计了一种新的高效星形边界框特征表示法,用于预测IACS得分并改进边界框。

4.提出了一种基于FCOS架构的新型密集目标检测器,并提出了名为VarifocalNet或VFNet的检测网络,以利用IACS的优势。

Motivation:

为了探索出候选框质量的排序依据和性能上限,本文以FCOS+ATSS为baseline,利用NMS之前的目标对应的gt真实值替换预测的分类得分,位置偏移和Centerness得分,并进行AP性能评估。 对于分类概率向量,有两种实现方法,在其gt标签位置的元素替换为一个1的数值,或者替换为预测框与gt框的IOU值。 除了gt真值之外,本文还考虑用gt IoU代替Centerness得分。

备注:这里的意思是假设不同的排序依据是绝对可靠的(使用gt),来探索究竟哪种依据带来的提升最大。
单阶段目标检测新网络-VarifocalNet | VarifocalNet: An IoU-aware Dense Object Detector
看一下具体实验结果:
1.baseline + centerness AP得分39.2
2.baseline + centerness替换为gt_centerness,39.2->41.1
3.baseline + centerness替换为gt_iou,39.2->43.5
这表明使用预测的IoU得分与分类得分的乘积对检测进行排序肯定无法带来显着的性能提升。centerness得分同样道理
4.baseline+gt_bbox,39.2->56.1,这里直接把所有的groudtruth bbox放进候选检测?不是很懂
5.baseline+gt_cls,即将gt位置的分类标签设置为1,这时候是否使用centerness将有明显区别,43.1 vs 58.1
6.baseline+gt_cls_iou,将于gt的iou替换为5中的gt_cls,作为分类得分。直接74.7AP,加上centerness反而会降低到67.4AP

以上实验对比,具有更高IOU的候选检测是高质量的检测结果,这些结果表明IOU感知的排序策略(IACS)是最有效的选择方案

VarifocalNet:

单阶段目标检测新网络-VarifocalNet | VarifocalNet: An IoU-aware Dense Object Detector
如上图所示,VarifocalNet以FCOS+ATSS(移除掉Centerness分支)为Base Net,新增了3个组成部分:Varifocal Loss, 星形边界框特征表示和边界框优化

A.Varifocal Loss