论文题目:An Analysis of Scale Invariance in Object Detection – SNIP
论文链接:https://arxiv.org/abs/1711.08189
代码链接:http://bit.ly/2yXVg4c

Motivation:
实现多尺度的检测一直是目标检测领域中的一个亟待解决的关键问题,而这就需要考虑其尺度不变性(scale invariance)的性质。作者对coco数据集的尺度进行了分析,见Figure1。图中,横坐标代表了GT目标与图像大小的IoU比,纵坐标代表了尺度的概率分布(每个IoU所对应该值以内GT的比重)。可以看出,coco数据集有一半的GT是小于0.106的,可见其小目标占有很大比重;另外,最小(<10%)和最大(>90%)的目标的尺度分别为0.024和0.472,相差20多倍,可见coco的尺度变化大(曲线向上凸起)。这种尺度的变化(variation in scale)和尺度不变性(scale invariation)都是亟待解决的问题。另外,目标检测算法使用的分类预训练模型与其训练使用的目标尺度的差异(domain-shift)也是提高检测性能的问题关键。
SNIP:多尺度的目标检测
innovation point:
1、对训练和测试、分类预训练模型和检测模型所使用数据集尺度的差异所带来的不利影响进行了详细的分析。(思路,先在分类上进行实验,然后推广到检测)。
2、受多尺度训练(**Muti-Scale Training)思想的启发,在该基础上,提出Scale Normalization for Image Pyramids(SNIP)模块,即只对与预训练尺度相匹配的目标进行梯度回传(back-propagation*。这样可以同时解决多尺度检测和*domain-shift问题。

关于具体实施细节,参考两篇比较不错的博文;
1、https://blog.csdn.net/u014380165/article/details/8079333
2、https://blog.csdn.net/qq416261970/article/details/79774909