Anchor-free目标检测综述 — Keypoint-based篇

2023年4月8日上午12:52 • 目标检测

早期目标检测研究以anchor-based为主，设定初始anchor，预测anchor的修正值，分为two-stage目标检测与one-stage目标检测，分别以Faster R-CNN和SSD作为代表。后来，有研究者觉得初始anchor的设定对准确率的影响很大，而且很难找到完美的预设anchor，于是开始不断得研究anchor-free目标检测算法，意在去掉预设anchor的环节，让网络自行学习anchor的位置与形状，在速度和准确率上面都有很不错的表现。anchor-free目标检测算法分为两种，一种是DenseBox为代表的Dense Prediction类型，密集地预测的框的相对位置，另一种则是以CornerNet为代表的Keypoint-bsaed Detection类型，以检测目标关键点为主。
本文主要列举几种Keypoint-based Detection类型的网络，主要涉及以下网络：

CornerNet

CornerNet将目标检测定义为左上角点和右下角点的检测。网络结构如图1所示，通过卷积网络预测出左上角点和右下角点的热图，然后将两组热图组合输出预测框，彻底去除了anchor box的需要。论文通过实验也表明CornerNet与当前的主流算法有相当的性能，开创了目标检测的新范式。

Anchor-free目标检测综述 -- Keypoint-based篇

CornerNet的结构如图4所示，使用hourglass网络作为主干网络，通过独立的两个预测模块输出两组结果，分别对应左上角点和右下角点，每个预测模块通过corner池化输出用于最终预测的热图、embedding向量和偏移。

ExtremeNet

Anchor-free目标检测综述 -- Keypoint-based篇

ExtremeNet通过检测目标的四个极点进行目标定位，如图1所示。整体算法基于CornerNet的思想进行改进，使用五张热图分别预测目标的四个极点以及中心区域，将不同热图的极点进行组合，通过组合的几何中心在中心点热图上的值判断组合是否符合要求。另外，ExtremeNet检测的极点能够配合DEXTR网络进行目标分割信息的预测。

CenterNet

Anchor-free目标检测综述 -- Keypoint-based篇

CornerNet将目前常用的anchor-based目标检测转换为keypoint-based目标检测，使用角点对表示每个目标，CornerNet主要关注目标的边界信息，缺乏对目标内部信息的获取，很容易造成误检，如图1所示。为了解决这个问题，论文提出CenterNet，在角点对的基础上加入中心关键点组成三元组进行检测，既能捕捉目标的边界信息也能兼顾目标的内部信息。另外，为了更好地提取特征，论文还提出了center pooling和cascade corner pooling，分别用于更好地提取中心关键点和角点。

CenterNet(Object as Point)

Anchor-free目标检测综述 -- Keypoint-based篇

CenterNet算法将检测目标视为关键点，先找到目标的中心点，然后回归其尺寸。首先将输入的图片转换成热图，热图中的高峰点对应目标的中心，将高峰点的特征向量用于预测目标的高和宽，如图2所示。在推理时，只需要简单的前向计算即可，不需要NMS等后处理操作。对比上一篇同名的CenterNet算法，这个算法更简洁且性能足够强大，不需要NMS等后处理方法，能够拓展到其它检测任务中。

CSP

Anchor-free目标检测综述 -- Keypoint-based篇

CSP的网络结构大致如图1所示，在主干网络上分别预测目标中心点的位置及其对应的尺寸。这篇文章的整体思想与CenterNet(zhou. etc)基本一致，但不是抄袭，因为是同一个会议上的论文，CenterNet主要研究常规的目标检测，而这篇主要研究人脸检测和行人检测。但CSP仍然需要进行NMS的后处理，较CenterNet更逊色一些，但不妨碍我们进行简单地了解，包括学习论文的训练方法以及参数。

CornerNet-Lite

CornerNet作为Keypoint-based目标检测算法中的经典方法，虽然有着不错的准确率，但其推理很慢，大约需要1.1s/张。虽然可以简单地缩小输入图片的尺寸来加速推理，但这会极大地降低其准确率，性能比YOLOv3要差很多。为此，论文提出了两种轻量级的CornerNet变种：CornerNet-Saccade和CornerNet-Squeeze。

Anchor-free目标检测综述 -- Keypoint-based篇

CornerNet-Saccade在可能出现目标的位置的小区域内进行目标检测，首先通过缩小的完整图片预测attention特征图，获得初步的预测框位置以及尺寸，然后在高分辨率图片上截取以该位置为中心的图片区域进行目标检测。

Anchor-free目标检测综述 -- Keypoint-based篇

在CornerNet中，大多数的计算时间花在主干网络Hourglass-104的推理。为此，CornerNet-Squeeze结合SqueezeNet和MobileNet来减少Hourglass-104的复杂度，设计了一个新的轻量级hourglass网络。

RepPoints

经典的bounding box虽然有利于计算，但没有考虑目标的形状和姿态，而且从矩形区域得到的特征可能会受背景内容或其它的目标的严重影响，低质量的特征会进一步影响目标检测的性能。为了解决bounding box存在的问题，论文提出了RepPoints这种新型目标表示方法，能够进行更细粒度的定位能力以及更好的分类效果。

Anchor-free目标检测综述 -- Keypoint-based篇

RepPoints是一个点集，能够自适应地包围目标并且包含局部区域的语义特征。论文基于RepPoints设计了anchor-free目标检测算法RPDet，包含两个识别阶段。因为可变形卷积可采样多个不规则分布的点进行卷积输出，所以可变形卷积十分适合RepPoints场景，能够根据识别结果的反馈进行采样点的引导。

CentripetalNet

CornerNet打开了目标检测的新方式，通过检测角点进行目标的定位，在角点的匹配上，增加了额外embedding向量，向量距离较小的角点即为匹配。而论文认为，这种方法不仅难以训练，而且仅通过物体表面进行预测，缺乏目标的位置信息。

Anchor-free目标检测综述 -- Keypoint-based篇

CentripetalNet的核心在于提出了新的角点匹配方式，额外学习一个向心偏移值，偏移后足够近的角点即为匹配。如图2所示，CentripetalNet包含四个模块，分别为：

角点预测模块(Corner Prediction Module)：用于产生候选角点，这部分跟CornerNet一样。
向心偏移模块(Centripetal Shift Module)：预测角点的向心偏移，并根据偏移结果将相近的角点成组。
十字星变形卷积(Cross-star Deformable Convolution)：针对角点场景的变形卷积，能够高效地增强角点位置的特征。
实例分割分支(Instance Mask Head)：类似MaskRCNN增加实例分割分支，能够提升目标检测的性能以及增加实例分割能力。

SaccadeNet

Anchor-free目标检测综述 -- Keypoint-based篇

SaccadeNet的结构如图2所示，首先初步预测目标的中心位置以及角点位置，然后利用四个角点位置以及中心点位置的特征进行回归优化。整体思想类似于two-stage目标检测算法，将第二阶段的预测框精调用的区域特征转化为点特征，在精度和速度上都可圈可点，整体思想十分不错。

RepPointsV2

Anchor-free目标检测综述 -- Keypoint-based篇

RepPointsV2的整体思想类似与Mask R-CNN，加入更多的任务来监督目标检测算法的学习，具体的实现方法是在原网络上加入辅助分支(auxiliary side-branches)的形式，有监督地进行学习，辅助分支能够优化中间特征以及进行联合检测。

CPNDet

Anchor-free目标检测综述 -- Keypoint-based篇

本文为CenterNet作者发表的，作者认为acnhor-free方法通常会出现大量的误检，需要一个独立的分类器来提升检测的准确率。于是结合acnhor-free方法和two-stage范式提出了Corner-Proposal-Network(CPN)，完整的结构如图2所示。首先使用anchor-free方法提取关键点，遍历关键点组合成候选框，最后使用两个分类器分别对候选框进行误检过滤以及标签预测。

如果本文对你有帮助，麻烦点个赞或在看呗～
更多内容请关注微信公众号【晓飞的算法工程笔记】

work-life balance.

Anchor-free目标检测综述 -- Keypoint-based篇

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Anchor-free目标检测综述 — Keypoint-based篇 - Python技术站

人工智能目标检测

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

Anchor-free目标检测综述 — Dense Prediction篇

上一篇 2023年4月8日上午12:52

显著目标检测的研究思路

下一篇 2023年4月8日

Keras文本预处理详解

汇总 Tokenizer分词器（类） Tokenizer.fit_on_texts分词器方法：实现分词 Tokenizer.texts_to_sequences分词器方法：输出向量序列 pad_sequences进行padding 具体示例和代码分析分词器分词和向量化主要的类是Tokenizer，用到其中的一些方法将文本转换为序列。需要注意的是这个类的一…

Keras 2023年4月6日
000
卷积神经网络

通过自适应卷积的视频帧插值——CGB

论文链接：https://arxiv.org/abs/1703.07514 论文题目：Video Frame Interpolation via Adaptive Convolution（通过自适应卷积的视频帧插值）发表时间：2017年CVPR 作者及其背景：Simon Niklaus, Long Mai, Feng Liu（波特兰州立大学Po…

2023年4月6日
000
Ubuntu新建用户以及安装pytorch

环境：Ubuntu18，Python3.6 首先登录服务器 ssh username@xx.xx.xx.xxx #登录一个已有的username 新建用户 sudo adduser username sudo usermod -aG sudo username 然后退出 exit 重新登录 ssh username@xx.xx.xx.xxx #这里是新创建的…

PyTorch 2023年4月8日
000
卷积神经网络

TensorFlow 卷积神经网络手写数字识别数据集介绍

http://www.tensorflownews.com/，学习更多的机器学习、深度学习的知识！手写数字识别接下来将会以 MNIST 数据集为例，使用卷积层和池化层，实现一个卷积神经网络来进行手写数字识别，并输出卷积和池化效果。数据准备 MNIST 数据集下载 MNIST 数据集可以从 THE MNIST DATABASE of handwritte…

2023年4月8日
000
caffe 中 plot accuracy和loss, 并画出网络结构图

plot accuracy + loss 详情可见：http://www.2cto.com/kf/201612/575739.html 1. caffe保存训练输出到log 并绘制accuracy loss曲线：之前已经编译了matcaffe 和 pycaffe，caffe中其实已经自带了这样的小工具。caffe-master/tools/extra/pa…

Caffe 2023年4月8日
000
目标检测

YOLOV3目标检测模型训练实例

从零开始学习使用keras-yolov3进行图片的目标检测，比较详细地记录了准备以及训练过程，提供一个信号灯的目标检测模型训练实例，并提供相关代码与训练集。 DEMO测试 YOLO提供了模型以及源码，首先使用YOLO训练好的权重文件进行快速测试，首先下载权重文件 https://pjreddie.com/media/files/yolov3.weights …

2023年4月8日
000
Caffe + Ubuntu 15.04 + CUDA 7.0 安装以及配置

本分分为四个部分，在Ubuntu上调试执行成功。第一部分：nVidia驱动和CUDA Toolkit的安装和调试；第二部分 Python安装和调试；第三部分 Matlab安装和调试；第四部分 Caffe的安装和測试。第一部分：nVidia驱动和CUDA Toolkit的安装和调试这里以CUDA 7.0为例。一、CUDA Repository 获取CUDA安…

Caffe 2023年4月8日
000
Keras

Keras实现LSTM

LSTM是优秀的循环神经网络(RNN)结构，而LSTM在结构上也比较复杂，对RNN和LSTM还稍有疑问的朋友可以参考：Recurrent Neural Networks vs LSTM 这里我们将要使用Keras搭建LSTM.Keras封装了一些优秀的深度学习框架的底层实现，使用起来相当简洁，甚至不需要深度学习的理论知识，你都可以轻松快速的搭建你的深度学习网…

2023年4月8日
000

合作推广

合作推广

返回顶部