目标检测算法-MRCNN

2023年4月7日下午11:59 • 目标检测

MRCNN网络结构:

目标检测算法-MRCNN

一.Activation maps Moudle

这个模块中将原始的输入图像，经过一系列的卷积操作输出feature map，这部分可以使用各种经典的网络结构，这部分就是提取原始图像的特征信息。

二.Region Adaptation Module

这部分就是给定一个Region和网络输出的feature map。此模块将Region映射到feature map上，进行裁剪后，连接到Adaptive Max-Pooling，并传到多个多层的网络中。

注意（Region需要进行变化）:

（1）每一种变化后的Region都要送到与变换对应的独立网络进行学习。

（2）在通过Region Adaption Module后需要将多个模型的结果拼接起来，得到最后的结果。

使用Region变换而且每中变换都要有单独的网络来训练有下面2点好处:

（1）可以迫使网络捕捉对象外观的各个互补方面

（2）可以使结果对不准确的定位更加敏感

下面介绍Region的几种变化:

目标检测算法-MRCNN

（f）是通过将候选框缩放 0.5 倍得到的。
（g）内部 box 是将候选框缩放 0.3 倍，而外部 box缩放 0.8 倍
（h）内部 box 将候选框放大 0.5 倍，外部 box 的大小与候选框相同。
（i）内部 box 是通过将候选框缩放 0.8 倍，而外部 box 缩放 1.5 倍
（j）内部 box 是候选框本身，外部 box 是通过将候选框缩放 1.8 倍得到的。

三.semantic-segmentation ware CNN model

目标检测算法-MRCNN

这个方法是将语义分割通过弱监督学习的方式用于目标检测来感知对象，图像分割相关的线索应该也是有助于目标检测的，这里使用FCN来训练前景的概率，训练方法是在Region Adaptation Module中添加一个Region变换，这个Region变换是将候选检测框方法1.5倍。然后将ground truth边界框内的标记为前景，将边界框外的标记为背景。放入FCN网络进行训练。在FCN被训练完成前景分割的辅助任务后，去掉最后一个分类层，只使用剩下的部分，最后将MRCNN网络的结果和此结果进行合并输出。（这个就是类似于Faster-RCNN中的RPN网络，为了找到更合适的框。）

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：目标检测算法-MRCNN - Python技术站

人工智能目标检测

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

目标检测算法-CRAFT

上一篇 2023年4月7日下午11:59

目标检测算法-Mask-RCNN

下一篇 2023年4月7日下午11:59

循环神经网络

吴恩达老师深度学习视频课笔记：循环神经网络

Why sequence models?：序列数据例子，如下图：(1).语音识别(speech recognition)：给定一个输入音频片段X，并要求输出片段对应的文字记录Y，这里输入和输出都是序列数据(sequence data)。因为X是按时序播放的音频片段，输出Y是一系列单词。(2). 音乐生成(music generation)：只有输出数据Y是序…

2023年4月8日
000
Keras

Keras tutorial – Emotion Detection in Images of Faces

所需文件：本地下载 Welcome to the first assignment of week 2. In this assignment, you will: Learn to use Keras, a high-level neural networks API (programming framework), written in Python …

2023年4月8日
000
PyTorch

《深度学习框架PyTorch：入门与实践》的Loss函数构建代码运行问题

在学习陈云的教程《深度学习框架PyTorch：入门与实践》的损失函数构建时代码如下：可我运行如下代码： output = net(input) target = Variable(t.arange(0,10)) criterion = nn.MSELoss() loss = criterion(output, target) loss 运行结果： Runt…

2023年4月8日
000
生成对抗网络（GAN，Generative Adversarial Network）介绍

生成对抗网络（GAN，Generative Adversarial Network）介绍 flyfish 在无监督学习中，最近的突破有哪些？看一个GAN的应用第一张图是用GAN将一副古代女子的画像恢复成真人的效果第二张是将真人效果图的面容表情更改成笑容++ Yann LeCun 的回答是有史以来GAN是最酷的事情。我在上一个答案中列出了许多相关论文。期望在未…

GAN生成对抗网络 2023年4月7日
000
目标检测

华科PAMI黑科技，方向任意目标检测新算法

在目标检测中，常用的目标包围框是水平矩形包围框，这对于一些目标方向不定的场景，并不能很好的进行检测。典型的场景比如遥感图像中的目标检测，船只、飞机、大型建筑物等目标的方向不保证总是平行于图像 x 轴。在场景文本检测、鱼眼图像行人检测、无人机航拍目标检测中也都存在这种问题。允许倾斜的带方向的包围框能更好的描述目标区域。华科等单位研究学者发表于计算机视觉顶级…

2023年4月8日
000
Keras

手写数字识别（keras）

数据准备课程中获取数据的方法是从库中直接load_data from keras.datasets import mnist (x_train, y_train), (x_test, y_test) = mnist.load_data() 我尝试了一下，报这样的错误：[WinError 10054] 远程主机强迫关闭了一个现有的连接。so，我就直接去官网下…

2023年4月8日
000
目标检测

【论文阅读】【3D目标检测】BirdNet: a 3D Object Detection Framework from LiDAR Information

文章目录 BirdNet 数据预处理处理网络后处理实验评价 BirdNet: a 3D Object Detection Framework from LiDAR Information西班牙马德里卡洛斯三世大学Intelligent Systems Laboratory (LSI) Research Group，发表在2018 ITSC上 Bird…

2023年4月8日
000
Caffe

Caffe for Windows 训练cifar10

我们学习Caffe提供的简单例程，目的是为了让初学者轻松上手，以examples/cifar10/为例，主要用于小图片的分类。 1 cifar10数据集 60000张32*32彩色图片，50000张训练，10000张测试下载cifar10数据集：http://www.cs.toronto.edu/~kriz/cifar-10-binary.tar.gz…

2023年4月8日
000

合作推广

合作推广

返回顶部