[目标检测]PVAnet原理

2023年4月8日上午3:06 • 目标检测

创新点：基于Faster-RCNN使用更高效的基础网络

1.1 创新点

PVAnet是RCNN系列目标方向，基于Faster-RCNN进行改进，Faster-RCNN基础网络可以使用ZF、VGG、Resnet等，但精度与速度难以同时提高。PVAnet的含义应该为：Performance Vs Accuracy，意为加速模型性能，同时不丢失精度的含义。主要的工作再使用了高效的自己设计的基础网络。该网络使用了C.ReLU、Inception、HyperNet以及residual模块等技巧。整体网络结构如图1所示。
[目标检测]PVAnet原理

2.1 C.ReLU

C.ReLU的作者观察基础网络卷积层参数，发现低层卷积核成对出现(参数互为相反数)，因此，作者减小输出特征图个数为原始一半，另一半直接取相反数得到，再将两部分特征图连接，从而减少了卷积核数目。关于C.ReLU参考博客与论文。C.ReLU的模块结构如图2所示。
[目标检测]PVAnet原理

2.2 Inception模块

作者发现googlenet中Inception模块由于具有多种感受野的卷积核组合，因此能够适应多尺度目标的检测，作者使用基于Inception模块组合并且组合跳级路特征进行基础网络后部分特征的提取。
[目标检测]PVAnet原理

2.3 HyperNet

将conv3中原图1/8特征图、conv3中原图1/16特征图、conv3中原图1/32特征图连接来增加最终特征图中多尺度信息。其中，conv3中特征图被下采样，conv5中特征图被线性插值上采样。如图1所示。

3.1 实验过程

除了以上基础网络的区别：
(1) PVAnet使用的anchor与faster-rcnn不同，PVA在每个特征点上使用了25个anchor(5种尺度，5种形状)。
(2) 并且RPN网络不使用全部特征图就能达到很好的定位精度，RPN网络只用生成200个proposals；
(3) 使用VOC2007、VOC2012、COCO一起训练模型；
(4) 可以使用类似于Fast-RCNN的truncated SVD来加速全连接层的速度;
(5) 使用投票机制增加训练精度，投票机制应该参考于R-FCN

参考：
PVAnet论文阅读笔记
 pva-faster-rcnn github

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：[目标检测]PVAnet原理 - Python技术站

人工智能目标检测

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

显著性目标检测（综述）

上一篇 2023年4月8日上午3:05

目标检测（6）—IOU和非极大值抑制

下一篇 2023年4月8日上午3:07

Keras

基于keras中IMDB的文本分类 demo

本次demo主题是使用keras对IMDB影评进行文本分类： import tensorflow as tf from tensorflow import keras import numpy as np print(tf.__version__) imdb = keras.datasets.imdb (train_data, train_label…

2023年4月8日
000
pytorch转置卷积(反卷积)参数说明，尺寸输入输出的计算

函数构造： class ConvTranspose2d(_ConvTransposeMixin, _ConvNd): def __init__(self, in_channels, out_channels, kernel_size, stride=1, padding=0, output_padding=0, groups=1, bias=True, di…

卷积神经网络 2023年4月5日
000
卷积神经网络

【33】卷积步长讲解(Strided convolutions)

卷积步长（Strided convolutions）卷积中的步幅是另一个构建卷积神经网络的基本操作，让我向你展示一个例子。如果你想用3×3的过滤器卷积这个7×7的图像，和之前不同的是，我们把步幅设置成了2。你还和之前一样取左上方的3×3区域的元素的乘积，再加起来，最后结果为91。只是之前我们移动蓝框的步长是1，现在移动的步长是2，我们让过滤器跳过2个步…

2023年4月5日
000
Caffe

Windows下利用MKL加速caffe，与openblas比较

一、介绍：先简单Mark一下网上的介绍资料，弄清楚MKL是个啥，已经与openblas等的关系。矩阵运算库blas, cblas, openblas, atlas, lapack, mkl之间有什么关系，在性能上区别大吗？摘自：https://www.zhihu.com/question/27872849 比较OpenBLAS，Intel MKL和Eig…

2023年4月8日
000
机器学习面试问题整理(3) — Tree树形模型

文章目录概述决策树笔记随机森林优缺点 GBDT的原理，如何做分类和回归 GBDT分类树拟合的是什么 GBDT+ LR 是怎么做的 CART分类回归树和ID3以及C4.5有什么区别决策树的优点和缺点 RF, GBDT, XGBOOST, XGB的区别改变随机森林的训练样本数据量，是否会影响到随机森林学习到的模型的复杂度树集成模型有哪几种形式？随…

机器学习 2023年4月10日
000
PyTorch–生成对抗网络（GAN）

在没了解它之前，我大概的印象就是它可以为我们创造更多的数据。用数学方式阐述训练算法： 1.初始化生成器的参数+鉴别器的参数 2.每次迭代执行下面的参数：前4步是升级鉴别器，后面两步是升级生成器；不想知道这个其中的原理，我只是使用，如有需要，再来仔细探究。

GAN生成对抗网络 2023年4月7日
000
pytorch seq2seq闲聊机器人

cut_sentence.py “”” 实现句子的分词注意点： 1. 实现单个字分词 2. 实现按照词语分词 2.1 加载词典 3. 使用停用词 “”” import string import jieba import jieba.posseg as psg import logging stopwords_path = “../corpus/stopw…

PyTorch 2023年4月8日
000
tensorflow

Tensorflow暑期实践——DeepDream以背景图片为起点

浙江财经大学专业实践深度学习tensorflow——阳诚砖 tensorflow_inception_graph.pb https://pan.baidu.com/s/1IbgQFAuqnGNjRQJGKDDOiA 提取码：2670 1.1 导入库与Inception模型 from __future__ import print_function impor…

2023年4月8日
000

合作推广

合作推广

返回顶部