第四部分目标检测 2 笔记

2023年4月8日上午9:51 • 目标检测

3.5 Bounding box预测

Bounding box predictions

YOLO algorithm(you only look once) —— 更精确的边界框检测算法。

第四部分目标检测 2 笔记

假设输入的图像大小为100x100，将图像划分为等大的方块，例如19x19的网格，为了简单起见，以3x3的网格举例。每个格子对应一个标签y，如3.1所述，每个y都是8维的，形式如y = [pc,bx,by,bh,bw,c1,c2,c3]。那么该图像3x3的网格对应的标签Y的维度是3x3x8。

每个格子(从左往右，从上往下)的标签示意：

1、格子1，没有对象。pc = 0 对应y = [0,?,?,?,?,?,?,?]

2、格子4，有对象。pc = 1 对应y = [1,bx,by,bh,bw,0,1,0]。

如何判断格子是否有对象？边界框的中点落在格子总，表明该格子内有对象，并且中点只会落在一个格子中，即一个对象只会对应应该格子，即使其边界框会跨越多个格子。

由于算法引入了格子，边界框对应的四元素bx,by,bh,bw，其计算尺度也是相应于对应格子的位置即尺寸。

YOLO与图像分类和定位算法非常像，首先它显式地输出边界框坐标，可以具有任意宽高比，并且能输出更精确的坐标，不会受到滑动窗口分类器的步长大小限制。其次，这是一个卷积实现，并没有在3×3网格上跑9次算法，或者，如果用的是19×19的网格，19平方是361次，所以不需要让同一个算法跑361次。相反，这是单次卷积实现，但使用了一个卷积网络，有很多共享计算步骤，在处理这3×3计算中很多计算步骤是共享的，所以YOLO效率很高(real time)。 YOLO是一个卷积实现，实际上它的运行速度非常快，可以达到实时识别。

3.6 交并比

Intersection over union

在对象检测任务中，希望能够同时定位对象，假设预测边界框是紫色的边界框，如何判断结果是好还是坏？可以用交并比来衡量。

交并比（loU）函数做的是计算两个边界框交集和并集之比。两个边界框的并集就是属于包含两个边界框区域（绿色阴影表示区域），而交集就是这个比较小的区域（橙色阴影表示区域），那么交并比就是交集的大小，这个橙色阴影面积，然后除以绿色阴影的并集面积。

一般约定，在计算机检测任务中，如果loU≥0.5，则检测正确，如果预测器和实际边界框完美重叠，loU就是1，因为交集就等于并集。但一般来说只要loU≥0.5，那么结果是可以接受的，看起来还可以。一般约定，0.5是阈值，用来判断预测的边界框是否正确。IoU设定的越高，越严格，相应的边界框越精确。

3.7 非极大值抑制

Non-max suppression

理论上这辆车只有一个中点，所以它应该只被分配到一个格子里，左边的车子也只有一个中点，所以理论上应该只有一个格子做出有车的预测。

实践中当运行对象分类和定位算法时，对于每个格子都运行一次，所以这个格子（编号1）可能会认为这辆车中点应该在格子内部，这格子（编号2、3）也会这么认为。对于左边的车子也一样。

当运行算法的时候，最后可能会对同一个对象做出多次检测，所以非极大值抑制做的就是清理这些检测结果。这样一辆车只检测一次，而不是每辆车都触发多次检测。非极大值抑制，非最大值意味着只输出概率最大的分类结果，但抑制很接近(根据loU值)，但不是最大的其他预测结果，所以这方法叫做非极大值抑制。

算法流程:

1、针对每个格子的预测输出，舍弃pc小于0.6的边界框。

2、选择剩下边界框对应概率pc最大的，将其作为一个预测结果。

3、舍弃与2中边界框交并比大于等于0.5的边界框(抑制)。

4、重复2-3，知道所有边界框都被处理。

当同时检测多种对象时，需要独立进行多次非极大值抑制。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：第四部分目标检测 2 笔记 - Python技术站

人工智能目标检测

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

干货 | 一文总结旋转目标检测全面综述：论文方法与代码

上一篇 2023年4月8日上午9:50

2017 2D目标检测论文跟踪

下一篇 2023年4月8日上午9:52

卷积神经网络

思考卷积神经网络（CNN）中各种意义

思考卷积神经网络（CNN）中各种意义只是知道CNN是不够，我们需要对其进行解剖，继而分析不同部件存在的意义 CNN的目的简单来说，CNN的目的是以一定的模型对事物进行特征提取，而后根据特征对该事物进行分类、识别、预测或决策等。在这个过程里，最重要的步骤在于特征提取，即如何提取到能最大程度区分事物的特征。如果提取的特征无法将不同的事物进行划分，那么该特征提…

2023年4月8日
000
PyTorch 多GPU下模型的保存与加载（踩坑笔记）

这几天在一机多卡的环境下，用pytorch训练模型，遇到很多问题。现总结一个实用的做实验方式：多GPU下训练，创建模型代码通常如下： os.environ[‘CUDA_VISIBLE_DEVICES’] = args.cuda model = MyModel(args) if torch.cuda.is_available() and args.use_g…

PyTorch 2023年4月8日
000
目标检测

目标检测领域中的数据不均衡问题综述

作者：Tom Hardy Date：2020-05-16 来源：目标检测领域中的数据不均衡问题综述参考：Imbalance Problems in Object Detection paper链接:https://arxiv.org/abs/1909.00169.pdf 主要内容和相关背景本文主要介绍了目标检测领域的八个数据不平衡问题，并将这些问题分类为…

2023年4月5日
000
循环神经网络

关于卷积神经网络（CNN）与递归/循环神经网络(RNN)的入门学习

最近科研看了两篇论文，上面分别用了两种方法，一种是卷积神经网络，另一种则是递归神经网络，因为之前没有接触过神经网络这一块知识，故特地整理一下，方便自己了解。卷积神经网络（CNN）卷积神经网络（Convolutional Neural Network）简称CNN，CNN是所有深度学习课程、书籍必教的模型，CNN在影像识别方面的为例特别强大，许多影像识别的模…

2023年4月6日
000
目标检测

目标检测（未用深度学习）

目标检测1 图像分割前景背景分割基于阈值的分割方法基于边缘的分割方法基于区域的分割方法区域生长法分水岭算法基于图论的分割方法 Graph Cut Grab Cut 人脸识别 Haar-like特征 Haar级联分类器级联分类器 Boosting分类器行人检测 HOG-SVM 梯度计算 Block拆分对比度归一化 HOG步骤 SVM模型 D…

2023年4月8日
000
cuda9.0编译caffe报错nvcc fatal : Unsupported gpu architecture ‘compute_70’

Tesla V100 cuda9.0 caffe编译的时候报上述错误，修改方法： CUDA_ARCH := #-gencode arch=compute_20,code=sm_20 \ #-gencode arch=compute_20,code=sm_21 \ -gencode arch=compute_30,code=sm_30 \ -gencode a…

Caffe 2023年4月6日
000
tensorflow

Ubuntu16.04系统Tensorflow源码安装

最近学习Tensorflow，记录一下安装过程。目前安装的是CPU版的 1、下载tensorflow源码 tensorflow是个开源库，在github上有源码，直接在上面下载。下载地址：https://github.com/tensorflow/tensorflow 2、安装python的一些依赖库 tensorflow支持C、C++和Python三种语言…

2023年4月8日
000
莫烦视频笔记–什么是GAN（生成对抗网络）？

最近最流行的一种生成网络叫做GAN，又称生成对抗网络，也是Generative Adversarial Nets的简称。神经网络分很多种，有普通的前向传播网络，有分析图片的CNN卷积神经网络，有分析序列化数据比如语音或者文字的RNN循环神经网络，这些网络都是通过输入数据得到想要的结果，我们看中的是这些神经网络中很好的将数据与结果通过某种关系联系起来。但是还…

GAN生成对抗网络 2023年4月7日
000

合作推广

合作推广

返回顶部