#Deep Learning回顾#之基于深度学习的目标检测（阅读小结）

2023年4月6日下午4:52 • 目标检测

原文链接：https://www.52ml.net/20287.html

这篇博文主要讲了深度学习在目标检测中的发展。

博文首先介绍了传统的目标检测算法过程：

传统的目标检测一般使用滑动窗口的框架，主要包括三个步骤：

利用不同尺寸的滑动窗口框住图中的某一部分作为候选区域；
提取候选区域相关的视觉特征。比如人脸检测常用的Harr特征；行人检测和普通目标检测常用的HOG特征等；
利用分类器进行识别，比如常用的SVM模型。

基于深度学习的目标检测分为两派：

基于区域提名的，如R-CNN、SPP-net、Fast R-CNN、Faster R-CNN、R-FCN；
端到端（End-to-End），无需区域提名的，如YOLO、SSD。

目前来说，基于区域提名的方法依然占据上风，但端到端的方法速度上优势明显，后续的发展拭目以待。

接下来是对相关研究的详细介绍。

1、首先介绍的是区域提名--选择性搜索，以及用深度学习做目标检测的早期工作--Overfeat。

选择性搜索：不断迭代合并候选区域，已被弃用。

OverFeat: 用CNN做分类、定位和检测的经典之作（马克一记）。

2、基于区域提名的方法：主要介绍R-CNN系列

R-CNN:之前的工作都是用滑动窗口的方式，速度很慢，R-CNN采用的是selective search。

它和OverFeat类似，但缺点是速度慢。

SPP-net：针对剪裁技术可能出现的问题，SPP不管是对整副图像还是裁剪后的图像，都提取

相同维度的特征，这样可以统一送至全连接层。

FAST R-CNN:主要解决2000个候选框带来的重复计算问题。

FASTER R-CNN：抛弃了selective search，引入了RPN网格。

R-FCN：将最后的全连接层换为了卷积层。

3、端到端（end-to-end）:无需区域提名

YOLO：将448*448的图像分成S*S的网络，简化目标检测流程；

SSD: YOLO的改进，分为两部分：图像分类的网络和多尺度特征映射网络。

目标检测还存在一些问题，比如小目标检测问题。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：#Deep Learning回顾#之基于深度学习的目标检测（阅读小结） - Python技术站

人工智能目标检测

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

动目标显示（MTI）雷达和动目标检测器（MTD）方框图

上一篇 2023年4月6日下午4:51

目标检测之视频摘要—即视频浓缩，视频检索，视频摘要浓缩

下一篇 2023年4月6日

【483】Keras 中 LSTM 与 BiLSTM 语法

参考：Keras-递归层Recurrent官方说明参考：Keras-Bidirectional包装器官方说明 LSTM(units=32, input_shape=(10, 64)) units=32：输出神经元个数 input_shape=(10, 64)：输入数据形状，10 代表时间序列的长度，64 代表每个时间序列数据的维度 LSTM(units=3…

Keras 2023年4月7日
000
在caffe-ssd安装编译环境运行make all时候报错：Makefile:572: recipe for target ‘.build_release/src/caffe/util/hdf5.o’ failed make: *** [.build_release/src/caffe/util/hdf5.o] Error 1

解决办法：修改：Makefile.config INCLUDE_DIRS /usr/include/hdf5/serial/ 修改：Makefile LIBRARIES hdf5_hl and hdf5 改为 hdf5_serial_hl ，hdf5_serial 其他make all之前的报错信息见：https://blog.csdn.net/fores…

Caffe 2023年4月5日
000
Keras

第20章 keras中“开箱即用”CNNs

到目前为止，我们学习了如何从头开始训练CNNs。这些CNNs大多数工作在浅层（以及较小数据集上），以至于它们可以很容易的在CPU上训练，而不需要在更贵的GPU上，这使得我们能够掌握神经网络和深度学习的基础。但是由于我们只在浅层网络上工作，我们无法利用深度学习带给我们的全分类能力。幸运的是，keras库预置了5种在ImageNet数据…

2023年4月6日
000
【机器学习基础】无监督学习（5）——生成模型

前面无监督学习主要针对的是一种“降维”的学习任务，将数据降维到另一个能够表达数据含义的某种空间中，本节主要是无监督学习中的另一个任务——生成进行介绍。生成模型 0.生成模型介绍通常生成模型是指学习样本数据的分布，可以生成一些新的数据，是相对于判别模型而言的，并不特指有监督学习和无监督学习，比如朴素贝叶斯模型就是一种生成模型。在这里生成模型主要指的是无监…

机器学习 2023年4月11日
000
动手学pytorch-Transformer代码实现

Transformer代码实现 1.Masked softmax2.Multi heads attention3.Position wise FFN4.Add and Norm5.Position encoding6.Encoder block7.Transformer Encoder8.Decoder block9.Transformer Decoder …

PyTorch 2023年4月6日
000
mac 下安装caffe(一）

1.brew install –build-from-source -vd boost boost-python 这一步出错：libtool: unrecognized option `-static’ 编译过程中调用了”libtool” -static -o “xx.a” “xxx.o” 命令进行静态链接。 MERRICKMEI-MB0:/ merr…

Caffe 2023年4月8日
000
CNN autoencoder 进行异常检测——TODO，使用keras进行测试

Convolutional Autoencoder: Clustering Images with Neural Networks https://blog.keras.io/building-autoencoders-in-keras.html https://datascience.stackexchange.com/questions/17737/…

Keras 2023年4月8日
000
卷积操作的维度

常见的库如opencv, theano等的卷积操作方法(cv2.filter2D, theano.tensor.nnet.conv2d)都有带有\(2d\), 这个2d代表什么呢? # 卷积操作的维度进行conv操作时, 它的前进方向的维度就是conv操作的维度. 例如最常见的图片conv操作只沿长与宽两个方向进行, 所以是$2D$的conv. 若conv操…

卷积神经网络 2023年4月8日
000

合作推广

合作推广

返回顶部