我先把效果展示一哈,如果有感兴趣或追问的人多,我会再继续补充完整过程(代码啦,数据集啦,思路啦)

(小声地说:主要原因是今晚绝地求生的全球邀请赛有OMG战队啊,我赶着回去看嘿嘿)

设备:GTX 950M

难点:图片相对目标大,常用的目标检测框架难以适用,因为要在一张1700*900的图片进行目标只有大约20*20大小的检测,常用框架是不行的,目标太小;如果用滑动窗口,效果是能接受的,但是耗时为2个小时以上。

借鉴了overfeat的滑动卷积思想,我试着做了一下卷积层的滑动窗口检测

今天终于把效果做得不错了,模型也具有很好的普适性和泛化性

处理一张1700*900分辨率左右的机场图片,所耗费的时间:30s(机器发热了可能要50秒)

ps:有大佬赞助1080ti吗!!!这样用下去,电脑感觉命不久矣!!

先把实验结果贴上

基于卷积层的滑动窗口目标检测——飞机篇

基于卷积层的滑动窗口目标检测——飞机篇

基于卷积层的滑动窗口目标检测——飞机篇

基于卷积层的滑动窗口目标检测——飞机篇