本人学术小渣,最开始研究的是目标检测的指标,里面用到了ground Truth,使用预测的边界框与ground Truth边界框的交并比(即IoU)来量化预测结果的准确度。我曾经一度以为正样本就是ground Truth边界框,负样本就是在背景中随机采样到的边界框。直到最近回顾目标检测算法,才慢慢开始明白。参考链接,描述如下:

参考faster以及SSD两种检测框架中对于正负样本的选取准则,首先,检测问题中的正负样本并非人工标注的那些框框,而是程序中(网络)生成出来的ROI也就是faster rcnn中的anchor boxes以及SSD中在不同分辨率的feature map中的默认框,这些框中的一部分被选为正样本,一部分被选为负样本,另外一部分被当作背景或者不参与运算。不同的框架有不同的策略,大致都是根据IOU的值,选取个阈值范围进行判定,在训练的过程中还需要注意均衡正负样本之间的比例。在fast的框架中,也是需要多SS算法生成的框框与GT框进行IOU的判断,进而选取正负样本,总之,正负样本都是针对于程序生成的框框而言,而非GT数据。

选取的正负样本是用来训练回归损失或者分类损失的。