目标检测算法RCNN，Fast RCNN，Faster RCNN

2023年4月6日上午12:29 • 目标检测

@

一、REGION CNN
二、Fast RCNN
三、Faster R-CNN

1.1 原理

滑窗法是一种行之有效的暴力方法，先生成大量的候选框，对每个框进行分类，可以大概的检测出类

目标检测算法RCNN，Fast RCNN，Faster RCNN

一张图像生成1K~2K个候选区域
对每个候选区域，使用深度网络提取特征
特征送入每一类的SVM分类器，判别是否属于该类
使用回归器精细修正候选框位置

1.2 候选区域生成方法

目标检测算法RCNN，Fast RCNN，Faster RCNN

使用了Selective Search方法从一张图像生成约2000-3000个候选区域。基本思路:

传统分割算法（如像素点聚合)，将图像分割成小区域
使用贪心算法合并候选区域：计算所有相邻区域的相似度。将最相似的两个区域合并为一个区域。重复直到整张图像合并成一个区域位置
输出所有曾经存在过的区域，生成候选区域

1.3 训练过程

预训练:在lmageNet上面训练一个分类神经网络
使用Selective Search找出候选区域
将候选区域resize成CNN输入的尺寸
fine-tuning:在自己的训练数据集中fine-tune CNN,作为一个识别K+1种类别的分类问题,K为感兴趣的目标种类数,1为背景类别.Fine-tune使用比较小的learning-rate,在正样本上面oversample (selective search出来的候选区域大多为背景)
去掉fine-tune后的CNN的最后一个分类层,将每一个候选区域通过CNN,输出为一个特征向量，
使用特征向量为每一个类别训练一个二元SVM分类器(正样本为候选区域和真实区域loU大于等于0.3的区域,其它为负样本)
为了减少Selective Search候选区域定位误差,使用regression模型预测新的定位
di是和ti一样的转换后的比例值

目标检测算法RCNN，Fast RCNN，Faster RCNN

1.4 R-CNN的计算瓶颈

· 对于每一幅图,使用Selective Search选择2000个候选区域,这个过程本身比较慢
. 2000个区域都要使用CNN网络预测图像特征,这些区域还会有重叠的部分
· 4个分离的部件没有重用计算:

Selective Search:选择候选区域
CNN:提取图像特征
SVM:目标分类识别 Regression模型:定位

二、Fast RCNN

目标检测算法RCNN，Fast RCNN，Faster RCNN

2.1 改进点

将R-CNN中下面3个独立模块整合在一起,减少计算量:
- CNN:提取图像特征
- SVM:目标分类识别
- Regression模型:定位
不对每个候选区域独立通过CNN提取特征,将整个图像通过CNN提取特征,然后从CNN的特征图中根据Selection Search的候选区域通过Rol Pooling层提取区域特征

2.2 网络结构

目标检测算法RCNN，Fast RCNN，Faster RCNN

2.3 ROI Pooling

目标检测算法RCNN，Fast RCNN，Faster RCNN

将任意大小的特征图(CNN的输出)使用Max Pooling转换为固定大小的特征图.
假设Rol Pooling的输入为H1* W1像素,输出为H2W2像素(H2<H1; W2< W1),那么输入特征图会被平均分为H2 W2个格子(每一个格子包含H1/H2 * W1/W2个像素).然后对每一个格子做MaxPooling.

2.4 损失函数

目标检测算法RCNN，Fast RCNN，Faster RCNN

2.5 总结

优点：

由于图像只通过CNN一次,而不是让每一个候选区独立通过CNN,减少了运算量
将R-CNN中的多个SVM的分类合并为一个DNN,让分类和定位可以同时训练

缺点：

但是任然依靠Selective Search选择候选区域

三、Faster R-CNN

去掉selective Search,将候选区域的选择整合到深度学习网络模型中(Region Proposal Network: RPN和fast R-CNN结合)
目标检测算法RCNN，Fast RCNN，Faster RCNN

3.1 RPN网络

目标检测算法RCNN，Fast RCNN，Faster RCNN

3*3的滑窗。在每个中心生成k（k=9）个anchor boxes。每个anchor boxes需要判断里面是否有需要识别的物体（前景和背景），所以有2k个得分。每个anchor boxes还有四个坐标，所以有4k个坐标

一个点处的anchor boxes

3.2 损失函数

目标检测算法RCNN，Fast RCNN，Faster RCNN

3.3 训练步骤

目标检测算法RCNN，Fast RCNN，Faster RCNN

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：目标检测算法RCNN，Fast RCNN，Faster RCNN - Python技术站

人工智能目标检测

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

目标检测带标签样本增广工具

上一篇 2023年4月6日

计算机视觉目标检测的框架与过程

下一篇 2023年4月6日

如何真正“不花一分钱”部署一个属于你的大模型

前言看了那么多chatGPT的文章，作为一名不精通算法的开发，也对大模型心痒痒。但想要部署自己的大模型，且不说没有算法相关的经验了，光是大模型占用的算力资源，手头的个人电脑其实也很难独立部署。就算使用算法压缩后的大模型，部署在个人电脑上，还要忍受极端缓慢的计算速度以及与chatGPT相差甚远的模型效果。有什么办法能够部署属于我们自己的大模型呢？其实很简单…

人工智能概论 2023年4月23日
000
2022！影响百万用户金融信用评分，Equifax被告上法庭，罪魁祸首——『数据漂移』！⛵

数据随着时间变化，会导致已有模型的准确度大打折扣，这就是数据漂移问题。本文讲解数据漂移问题的诸多实际案例、检测方法、基于evidently库的代码实现。 ? 作者：韩信子@ShowMeAI? 数据分析实战系列：https://www.showmeai.tech/tutorials/40? 机器学习实战系列：https://www.showmeai.tech/…

机器学习 2023年4月11日
000
Caffe

Caffe学习记录(十二) ICNet分割网络学习二

在ICNet分割网络训练的过程中，发生了很郁闷的事情，首先ICNet的训练数据准备，和segnet一样，需要准备原始数据，mask 已经对应的txt文件，格式为pathofdata 空格 pathofmask 在训练过程中，需要把mask转化为二值化也就是只包含0,1值的像素。但是虽然转过了，还是会报 CUBLAS_STATUS_SUCCESS (11 …

2023年4月8日
000
GAN生成对抗网络

AI佳作解读系列(六) －生成对抗网络（GAN）综述精华

注：本文来自机器之心的PaperWeekly系列：万字综述之生成对抗网络（GAN），如有侵权，请联系删除，谢谢！前阵子学习 GAN 的过程发现现在的 GAN 综述文章大都是 2016 年 Ian Goodfellow 或者自动化所王飞跃老师那篇。可是在深度学习，GAN领域，其进展都是以月来计算的，感觉那两篇综述有些老了。最近发现有一篇最新的 GAN 综…

2023年4月5日
000
莫烦pytorch学习笔记(二)——variable

1.简介 torch.autograd.Variable是Autograd的核心类，它封装了Tensor，并整合了反向传播的相关实现 Variable和tensor的区别和联系 Variable是篮子，而tensor是鸡蛋，鸡蛋应该放在篮子里才能方便拿走（定义variable时一个参数就是tensor） Variable这个篮子里除了装了tensor外还有r…

PyTorch 2023年4月8日
000
目标检测

实时车辆行人多目标检测与跟踪系统-上篇（UI界面清新版，Python代码）

摘要：本文详细介绍如何利用深度学习中的YOLO及SORT算法实现车辆、行人等多目标的实时检测和跟踪，并利用PyQt5设计了清新简约的系统UI界面，在界面中既可选择自己的视频、图片文件进行检测跟踪，也可以通过电脑自带的摄像头进行实时处理，可选择训练好的YOLO v3/v4等模型参数。该系统界面优美、检测精度高，功能强大，设计有多目标实时检测、跟踪、计数功能，可…

2023年4月6日
000
Tensorflow 池化层（pooling)和全连接层(dense)

一、池化层（pooling）池化层定义在 tensorflow/python/layers/pooling.py. 有最大值池化和均值池化。 1. 最大池化层 tf.layers.max_pooling2d max_pooling2d( inputs, pool_size, strides, padding=’valid’, data_format=’ch…

tensorflow 2023年4月8日
000
卷积神经网络

14 深度学习-卷积 – 广商吴彦祖

14 深度学习-卷积 2020-06-07 19:01 广商吴彦祖阅读(115) 评论(0) 编辑收藏举报 1.简述人工智能、机器学习和深度学习三者的联系与区别。要解释这三者之间的关系和应用，最简单的方法就是画一个同心圆，人工智能是最早出现的，也是最大、最外侧的同心圆；其次是机器学习，稍晚一点；最内侧，是深度学习，也是当今人工智能大爆炸的核心驱动。 …

2023年4月8日
000

合作推广

合作推广

返回顶部