解决小目标检测问题的一般方法:提高输入图像的分辨率,会增加运算量;多尺度特征表示,结果不可控。
方法提出
论文使用感知生成式对抗网络(Perceptual GAN)提高小物体检测率,generator将小物体的poor表示转换成super-resolved的表示,discriminator与generator以竞争的方式分辨特征。Perceptual GAN挖掘不同尺度物体间的结构关联,提高小物体的特征表示,使之与大物体类似。包含两个子网络,生成网络和感知分辨网络。生成网络是一个深度残差特征生成模型,通过引入低层精细粒度的特征将原始的较差的特征转换为高分变形的特征。分辨网络一方面分辨小物体生成的高分辨率特征与真实大物体特征,另一方面使用感知损失提升检测率。在交通标志数据库Tsinghua-Tencent
100k及Caltech上实验。
Perceptual GAN
1. 概述
目标函数:
G标识生成器,D是分辨器。训练G的过程,最大化D犯错的概率。x,z是大物体,小物体的表示。学习G将小物体的标识转换为超分辨的形式,使之类似于大目标的特征。由于信息的缺乏,这个过程比较困难。引入附加信息,学习大物体和小物体见的残差表示,即,
分辨器有两个分支,对抗分支分辨生成的小物体特征与实际大物体特征,感知分支解释生成表示的检测率增益。使用交替的方式优化生成器和分辨器网络的参数,解决对抗min-max问题。训练对抗网分支最大化分配相同标签给小物体生成特征和大物体特征的概率。分辨网络是为了尽可能的找出小物体生成特征和实际大物体特征的不同。这样监督生成网络生成更接近实际的小物体特征。Perceptual GAN总体结构如下图所示:
将物体分为大物体和小物体两个子集,感知分支先在大物体特征上训练,获得较高的检测率,然后使用小物体训练生成网络,两个子集对抗分支。交替训练生成网络和对抗分支,达到平衡点。
2. 生成网络
深度残差网络,增强小物体标识,生成器将conv1的输出作为输入,经历卷积,残差块学习大物体和小物体间的残差表示,学到的残差标识与原con5特征元素加操作,得到提升的表示。
3. 分辨网络结构
实验结果
与Faster-rcnn相比,小物体检测率确实提高很多,期待源码
生成网络生存的特征
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:目标检测“Perceptual Generative Adversarial Networks for Small Object Detection” - Python技术站