融合特征的SSD

[1709.05054] Feature-Fused SSD: Fast Detection for Small Objects https://arxiv.org/abs/1709.05054

论文:https://arxiv.org/ftp/arxiv/papers/1709/1709.05054.pdf

快速检测小目标,采用SSD作为基本结构,兼顾速度和准确度。

思路是使用高层的特征图来加强低层特征图的语义信息,以增加小物体检测精度。

不同层特征融合得到contextual information(上下文信息)的方法,并将其应用到SSD模型中。

小目标检测文献相关(特征融合)

SSD使用特征金字塔是为了兼顾不同尺度目标的检测,把最浅层的特征用到小目标检测上,因为浅层的感受野小,感受野的尺寸正好和小目标match。

浅层的特征缺乏语义信息(Semantic information) 。而语义信息会影响检测器判断检测区域是目标 (object) 还是背景 (background)。那么将高层特征与低层特征融合,将会得到感受野适合,而又不缺乏语义信息的特征。

Element-Sum module 和concatenation module两种融合方式:拼接时使用,concat还是sum操作。

concatenation module能降低遮挡的影响而Element-Sum module针对像素少和模糊的目标有更好的效果。

小目标检测文献相关(特征融合)

【转载自】

快速小目标检测--Feature-Fused SSD: Fast Detection for Small Objects - AI小作坊 的博客 - CSDN博客 https://blog.csdn.net/zhangjunhit/article/details/78031452

小目标检测:Feature-Fused SSD - 海星的博客 - CSDN博客 https://blog.csdn.net/weixin_39290638/article/details/84540806

Feature-Fused SSD: Fast Detection for Small Objects - DCD_LIN的博客 - CSDN博客 https://blog.csdn.net/linmingan/article/details/81095435

融合特征的SSD:对小目标的快速检测 - wangxujin666的博客 - CSDN博客 https://blog.csdn.net/wangxujin666/article/details/83065261

 

2、FPN(feature pyramid networks)

论文:feature pyramid networks for object detection  5 FPS
论文链接:https://arxiv.org/abs/1612.03144

这是cvpr2017年出的一篇文章,该文主要是针对通用目标的检测方法,但是在小目标检测中起到了关键作用,以至于之后的很多小目标检测方法都用到了类似的该方法,如faster-rcnn+fpn,yolov3中的特征融合。

为了在保证速度的同时实现更高的定位准确率,yolo v3 采用了更为复杂的网络结构。相较于此前的网络,yolo v3 的改进之处包括多尺度预测(FPN)、更复杂的网络的结构Darknet53、取消 softmax 作为候选框分类,这些都使得 yolo v3 的速度更快,准确率也有相应提高。

https://cloud.tencent.com/developer/news/302362

采用了多尺度特征融合的方式,采用不同特征层特征融合之后的结果来做预测。

低层的特征语义信息比较少,但是目标位置准确,高层的特征语义信息比较丰富,但是目标的位置粗略。

FPN的方法,得到每一层的特征图之后采用自顶向下的方法将小的特征图上采样之后与下一个特征图融合,融合之后再做预测,依次如此,即可得到多个预测结果。

Feature Pyramid Network

算法思想:作者提出了从上到下的路径和横向路径。从上到下的路径是指对网络结构深层的特征图进行上采样操作,使其跟网络浅层特征图大小一致,从而能够进行特征图堆叠。横向路径是指对每一卷积模块的最终特征图,采用1X1卷积核进行降通道操作, 减少特征图的个数。最终利用堆叠起来的多尺度特征图进行分类及定位的模型学习。
算法效果:对于FPN做法的可行性,作者指出,浅层特征图的语义特征较弱,而位置特征较强;相反,深层特征图的语义特征较强, 但损失了精确地位置特征。同时利用浅层特征图和深层特征图,能够综合考量强位置特征和强语义特征,因此提升模型效果。

Fully Convoluntional Network

算法思想:整体思想与FPN相似。创新点在于(1)舍弃了全连接层,将全连接层换为等价的1X1卷积核,从而使得网络输入的图片尺度可以不一致。(2)对堆叠后的特征图继续进行上采样,使得其和原图大小一致。对上采样后的堆叠特征图,在其映射到原图位置的像素点上做分类预测。这样,可以基于原图做出精细的图像分割。
算法效果:FCN开创了精细图像分割的先河,其之后的MASK-RCNN等算法也借鉴了其思想。对于小目标检测,可以通过像素点的分类,做出更精细的位置划分。

【转载自】

小目标检测文章总结 - wq604887956的博客 - CSDN博客 https://blog.csdn.net/wq604887956/article/details/83053927

小目标检测论文阅读 - 开心的火龙果的博客 - CSDN博客 https://blog.csdn.net/weixin_40683960/article/details/82078957

 

【其他】

https://cloud.tencent.com/developer/article/1414911

小目标检测:Improving Small Object Detection - 海星的博客 - CSDN博客 https://blog.csdn.net/weixin_39290638/article/details/84487984

卷积神经网络可以用于小目标检测吗? - 知乎 https://www.zhihu.com/question/49722539