目标检测——Faster R_CNN使用smooth L1作为bbox的回归损失函数原因

2023年4月7日下午10:12 • 目标检测

前情提要—— 网上关于目标检测框架——faster r_cnn有太多太好的博文，这是我在组会讲述faster r_cnn这一框架时被人问到的一个点，当时没答上来，于是会下好好百度和搜索一下研究了一下这个问题。

先看faster r_cnn的对bounding_box的回归损失函数：

目标检测——Faster R_CNN使用smooth L1作为bbox的回归损失函数原因

百度百科的解释是：对于边框的预测是一个回归问题。通常可以选择*方损失函数（L2损失）:f(x)=x^2。但这个损失对于比较大的误差的惩罚很高。我们可以采用稍微缓和一点绝对损失函数（L1损失）:f(x)=|x|，它是随着误差线性增长，而不是*方增长。但这个函数在0点处导数不唯一（这里应该是0点两边的导数，因为0点处导数不存在），因此可能会影响收敛。一个通常的解决办法是在0点附*使用*方函数使得它更加*滑。它被称之为*滑L1损失函数，它通过一个参数sigma来控制*滑的区域。

牛客网的解释：是当预测值与目标值相差很大时，L2 Loss的梯度为(x-t)，容易产生梯度爆炸，L1 Loss的梯度为常数，通过使用Smooth L1 Loss，在预测值与目标值相差较大时，由L2 Loss转为L1 Loss可以防止梯度爆炸。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：目标检测——Faster R_CNN使用smooth L1作为bbox的回归损失函数原因 - Python技术站

人工智能目标检测

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

Anchor-Free目标检测算法

上一篇 2023年4月7日

目标检测：介绍及传统方法

下一篇 2023年4月7日

循环神经网络

第3章循环神经网络（RNN与LSTM）——3.2 BP神经网络模型

1.正向传播，输入->隐含->输出层（1）网络初始化，定义每层节点和权重（2）隐藏层的输出（3）输出层的输出 2.误差计算 3.反向传播，误差反向传播，权重更新（1）隐藏层到输出层（2）输入层到隐藏层 4.偏置更新（1）隐藏层到输出层（2）输入层到隐藏层 5.BP神经网络，前馈神经网络（1）可以通过逐层信息传递到最后的输出（2）…

2023年4月8日
000
wgan pytorch,pyvision, py-faster-rcnn等的安装使用

因为最近在读gan的相关工作，wgan的工作不得不赞。于是直接去跑了一下wgan的代码。原作者的wgan是在lsun上测试的，而且是基于pytorch和pyvision的，于是要装，但是由于我们一直用的是python 2.7,所以无法从WGAN的页面上跳到pytorch的官方页面下载安装，需要安装github上的版本，这个是不需要python3.5的。重新…

PyTorch 2023年4月8日
000
ubuntu+python基础-3 tensorflow第一个程序

1 from tensorflow.examples.tutorials.mnist import input_data 2 mnist = input_data.read_data_sets(‘MNIST_data’, one_hot=True) 3 # 下载下来的数据集被分成两部分：60000行的训练数据集（mnist.train）和10000行的测试数…

tensorflow 2023年4月6日
000
PyTorch

Pytorch迁移学习

环境： Pytorch1.1，Python3.6，win10/ubuntu18，GPU 正文 Pytorch构建ResNet18模型并训练，进行真实图片分类；利用预训练的ResNet18模型进行Fine tune，直接进行图片分类；站在巨人的肩膀上，使用已经在ImageNet上训练好的模型，除了最后一层全连接层，中间层的参数全部迁移到目标模型上，如下图所示…

2023年4月8日
000
Caffe

深度学习caffe:Ubuntu16.04安装指南(1)

caffe [CPU ONLY] 2017-01-15 最简单的安装配置方式: 不用GPU加速,使用OPENCV2.4图像库, 这是根据官方教程(链接如下)简化而得到. Ubuntu 16.04 or 15.10 Installation Guide 1. 软件源更新刚刚安装好Ubuntu16.04的系统之后,第一步应该是更新软件源,有多种方式,这里使用的…

2023年4月8日
000
keras模型的保存与重新加载

1 # 模型保存JSON文件 2 model_json = model.to_json() 3 with open(‘model.json’, ‘w’) as file: 4 file.write(model_json) 5 6 # 保存模型权重值 7 model.save_weights(‘model.json.h5’) 8 9 # 从JSON文件中加载模…

Keras 2023年4月6日
000
卷积神经网络

TensorFlow——CNN卷积神经网络处理Mnist数据集

CNN卷积神经网络处理Mnist数据集 CNN模型结构：输入层：Mnist数据集（28*28）第一层卷积：感受视野5*5，步长为1，卷积核：32个第一层池化：池化视野2*2，步长为2 第二层卷积：感受视野5*5，步长为1，卷积核：64个第二层池化：池化视野2*2，步长为2 全连接层：设置1024个神经元输出层：0~9十个数字类别代码实现：…

2023年4月6日
000
GAN生成对抗网络

【图像上色小综述】生成对抗网络的GAN法

点击上方“机器学习与生成对抗网络”，关注”星标” 获取有趣、好玩的前沿干货！超100篇！CVPR 2020最全GAN论文梳理汇总！ 0，图像上色及其分类图像上色一般分为两种：无引导上色和有引导上色。顾名思义，无引导指的是全交由算法进行自动化上色，而有引导则在上色过程中有人为（其它参照）干预，比如给出一幅风格参考图像或指定某一区域为特定颜色。图像上色的…

2023年4月6日
000

合作推广

合作推广

返回顶部