MTCNN
全称Multi-task Cascaded Convolutional Networks, 多任务级联卷积神经网络
概览
MTCNN在训练时可以分开训练,使用时串联起来训练。p网络(propose)检测输出后resize再给r网络(refine),r网络输出最后给o网络(output).每个网络的的训练任务都有关键点,人脸置信度,偏移量,多个任务共同促使提高检测精度。p网络再检测时有一点不一样就是他需要经过图像金字塔,所以也就导致了p网络效率很低
样本制作:
MTCNN并不是直接拿目标框作为标签而是用偏移量来作为标签来训练,所以在制作样本时分为三类样本,正样本,部分样本,负样本。
正样本:一定要有人脸 置信度:1 IOU: 0.75~1
部分样本:有部分人脸 置信度:2 IOU: 0.4~0.75
负样本:不能有人脸 置信度:0 IOU: 0~0.3
样本所占比例:1:2:3(因为真实情况中就是负样本最多的)
训练:
正样本和负样本用来训练置信度, 部分样本和正样本用来训练偏移量。为什么用偏移量来训练,
图像金字塔:
侦测:
反算:
未完待续
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:目标检测之MTCNN - Python技术站