目标检测是CV的四大基本任务之一,也是现在CV最热门的技术,与技术落地息息相关。目标检测相比于分类与分割,它的损失函数要更难理解一点。

目标检测与边界框

目标检测应用的场景通常是一副图像里有很多要关注的目标,比如下图有猫和狗两个目标,我们要分别把它们的位置和大小框出来,这用到的框便叫边界框。目标检测是解决"在哪里有什么"的任务。
动手学深度学习之目标检测基础

锚框

锚框(Anchor)是目标检测算法最为核心的概念,它们与标注边界框的差异引出了损失函数会用到的两个变量:目标类别和位置偏移量。目标检测的损失函数既要考虑到预测出来的边界框包含的目标类别也要考虑到位置大小的正确。
至于锚框如何生成,在训练阶段如何使用,在测试阶段又如何使用,以及损失函数是什么,可以看这篇文章:
锚框:Anchor box综述