目标检测常用损失函数-类别损失+位置损失

2023年4月8日下午3:51 • 目标检测

目录

1. 交叉熵损失 Cross Entropy Loss

2. Focal Loss 改进的交叉熵损失函数

1. L1 Loss 平均绝对误差（Mean Absolute Error, MAE）

2. L2 Loss 均方误差损失（Mean Square Error, MSE）

3. Smooth L1 Loss

一般的目标检测模型包含两类损失函数，

一类是类别损失（分类），

另一类是位置损失（回归）。

这两类损失函数往往用于检测模型最后一部分，根据模型输出（类别和位置）和实际标注框（类别和位置）分别计算类别损失和位置损失。

类别损失

1. 交叉熵损失 Cross Entropy Loss

交叉熵损失是基于“熵”这个概念，熵用来衡量信息的不确定性。对于概率分布为p(X)的随机变量X,熵可以表示为：

目标检测常用损失函数-类别损失+位置损失

当X分布的不确定性越大，对应的熵越大（对应log(x)积分面积），反之，熵越小。

当把熵用于分类问题时，分类的结果越好（可以理解为预测为某一类的概率远高于其他类别的概率），不确定性越低，熵就越小；
反之，分类的结果越差（可以理解为预测的各个类别的概率都比较高，没有明确的分界线），此时不确定性越强，熵就越高。

针对以上分析，可以把熵用于分类问题的损失，根据分类的类别数量不同，可以分为二元交叉熵损失和多分类交叉熵损失。

对于二分类问题（即0-1分类），即属于第1类的概率为p，属于第0类的概率为1−p。则二元交叉熵损失可表示为：

目标检测常用损失函数-类别损失+位置损失

也可以统一写成如下形式：

目标检测常用损失函数-类别损失+位置损失

可以理解为：当实际类别为1时，我们希望预测为类别1的概率高一点，此时log(p)的值越小，产生的损失越小；反之，我们希望预测为类别0的概率高一点，此时log(1−p)的值越小，产生的损失也越小。

在实际应用中，二分类的类别概率通常采用sigmoid函数把结果映射到（0，1）之间。

目标检测常用损失函数-类别损失+位置损失 — 对数函数图像

对比二元交叉熵损失，可以推广到多分类交叉熵损失，定义如下：

目标检测常用损失函数-类别损失+位置损失

目标检测常用损失函数-类别损失+位置损失

在多分类实际应用中，通常采用SoftMax函数来得到样本属于每个类别的概率。

2. Focal Loss 改进的交叉熵损失函数

Focal Loss首次在目标检测框架RetinaNet中提出，RetinaNet可以参考

目标检测论文笔记：RetinaNet

它是对典型的交叉信息熵损失函数的改进，主要用于样本分类的不平衡问题。为了统一正负样本的损失函数表达式，首先做如下定义：

目标检测常用损失函数-类别损失+位置损失

目标检测常用损失函数-类别损失+位置损失

位置损失

1. L1 Loss 平均绝对误差（Mean Absolute Error, MAE）

L1 loss即平均绝对误差（Mean Absolute Error, MAE），指模型预测值和真实值之间距离的平均值。

目标检测常用损失函数-类别损失+位置损失

2. L2 Loss 均方误差损失（Mean Square Error, MSE）

L2 loss即均方误差损失（Mean Square Error, MSE），指预测值和真实值之差的平方的平均值。

目标检测常用损失函数-类别损失+位置损失

3. Smooth L1 Loss

Smooth L1 loss是基于L1 loss修改得到，对于单个样本，记x为预测值和真实值的差值，则对应的Smooth L1 loss可表示为：

目标检测常用损失函数-类别损失+位置损失

4. IoU Loss

IoU类的损失函数都是基于预测框和标注框之间的IoU（交并比），记预测框为P，标注框为G，则对应的IoU可表示为：

目标检测常用损失函数-类别损失+位置损失

即两个框的交集和并集的比值。IoU loss定义为：

目标检测常用损失函数-类别损失+位置损失

5. GIoU Loss

IoU反映了两个框的重叠程度，在两个框不重叠时，IoU衡等于0，此时IoU loss恒等于1。而在目标检测的边界框回归中，这显然是不合适的。因此，GIoU loss在IoU loss的基础上考虑了两个框没有重叠区域时产生的损失。具体定义如下：

目标检测常用损失函数-类别损失+位置损失

其中，C表示两个框的最小包围矩形框，R(P,G)是惩罚项。从公式可以看出，当两个框没有重叠区域时，IoU为0，但R依然会产生损失。极限情况下，当两个框距离无穷远时，R→1

6. DIoU Loss

IoU loss和GIoU loss都只考虑了两个框的重叠程度，但在重叠程度相同的情况下，我们其实更希望两个框能挨得足够近，即框的中心要尽量靠近。因此，DIoU在IoU loss的基础上考虑了两个框的中心点距离，具体定义如下：

目标检测常用损失函数-类别损失+位置损失

其中，ρ表示预测框和标注框中心端的距离，p和g是两个框的中心点。c表示两个框的最小包围矩形框的对角线长度。当两个框距离无限远时，中心点距离和外接矩形框对角线长度无限逼近，R→1

下图直观显示了不同情况下的IoU loss、GIoU loss和DIoU loss结果：

目标检测常用损失函数-类别损失+位置损失

其中，绿色框表示标注框，红色框表示预测框，可以看出，最后一组的结果由于两个框中心点重合，检测效果要由于前面两组。IoU loss和GIoU loss的结果均为0.75，并不能区分三种情况，而DIoU loss则对三种情况做了很好的区分。

7. CIoU Loss

DIoU loss考虑了两个框中心点的距离，而CIoU loss在DIoU loss的基础上做了更详细的度量，具体包括：

重叠面积
中心点距离
长宽比

具体定义如下：

目标检测常用损失函数-类别损失+位置损失

目标检测常用损失函数-类别损失+位置损失

注：关于IoU系列损失更详细的分析可以参考论文：Distance-IoU Loss: Faster and Better Learning for Bounding Box Regression

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：目标检测常用损失函数-类别损失+位置损失 - Python技术站

人工智能目标检测

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

目标检测后处理：从nms到softer nms

上一篇 2023年4月8日下午3:50

仅有 100k 参数的高效显著性目标检测方法

下一篇 2023年4月8日下午3:51

卷积神经网络

Deep Learning.ai学习笔记_第四门课_卷积神经网络

目录第一周卷积神经网络基础第二周深度卷积网络：实例探究第三周目标检测第四周特殊应用：人脸识别和神经风格转换垂直边缘检测器，通过卷积计算，可以把多维矩阵进行降维。如下图：卷积运算提供了一个方便的方法来发现图像中的垂直边缘。例如下图：对于3×3的过滤器，使用下面的数字组合鲁棒性比较高，这样的过滤器也称为Sobel过滤器。还…

2023年4月7日
000
Keras

Keras深度学习笔记线性回归

定义与公式线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。特点：只有一个自变量的情况称为单变量回归，多于一个自变量情况的叫做多元回归。单变量回归当只有一个变量时，线性模型的函数定义为：其中，权值w0为函数在y轴上的截距, w1为解释变量的系数。我们的目…

2023年4月8日
000
机器学习中的train valid test以及交叉验证

参考博客：http://blog.csdn.net/u010167269/article/details/51340070 在以前的网络训练中，有关于验证集一直比较疑惑，在一些机器学习的教程中，都会提到，将数据集分为三部分，即训练集，验证集与测试集，但是由于工作中涉及到的都是神经网络的训练，大部分的情况是将数据集分为train以及test两部分，直接用tra…

机器学习 2023年4月13日
000
目标检测

目标检测方法总结（R-CNN系列）

目录相关背景从传统方法到R-CNN 从R-CNN到SPP Fast R-CNN Faster R-CNN YOLO SSD 总结参考文献推荐链接相关背景 14年以来的目标检测方法（以R-CNN框架为基础或对其改进）各方法性能对比分类，定位，检测三种视觉任务的简单对比一般的目标检测方法从传统方法到R-CNN R-CNN的三大步…

2023年4月6日
000
PyTorch

Pytorch 细节记录

1. PyTorch进行训练和测试时指定实例化的model模式为：train/eval eg: class VAE(nn.Module): def __init__(self): super(VAE, self).__init__() … def reparameterize(self, mu, logvar): if self.training: st…

2023年4月8日
000
Keras

keras中TimeDistributed的用法

TimeDistributed这个层还是比较难理解的。事实上通过这个层我们可以实现从二维像三维的过渡，甚至通过这个层的包装，我们可以实现图像分类视频分类的转化。考虑一批32个样本，其中每个样本是一个由16个维度组成的10个向量的序列。该层的批输入形状然后(32, 10, 16)。可以这么理解，输入数据是一个特征方程，X1+X2+…+X10=Y，从矩阵…

2023年4月8日
000
循环神经网络

Course 5 – 序列模型 – 第一周作业 – 搭建循环神经网络及其应用

1.实现RNN网络的前向传播 1.1RNN cell的前向传播 1.2RNN的前向传播 #!/usr/bin/env python # _*_ coding:utf-8 _* import numpy as np import rnn_utils # 1.计算在rnn cell中基本的计算，根据A(t-1),X(t)计算A(t)/Y(t) def rnn…

2023年4月8日
000
Keras class_weight和sample_weight用法

搬运: https://stackoverflow.com/questions/57610804/when-is-the-timing-to-use-sample-weights-in-keras import tensorflow as tf import numpy as np data_size = 100 input_size=3 classes=3…

Keras 2023年4月6日
000

合作推广

合作推广

返回顶部