目标检测 anchor 理解笔记

2023年4月7日下午10:31 • 目标检测

anchor在计算机视觉中有锚点或锚框，目标检测中常出现的anchor box是锚框，表示固定的参考框。

目标检测的任务：

在哪里有东西

难点：

目标的类别不确定、数量不确定、位置不确定、尺度不确定

传统算法的解决方式：

都要金字塔多尺度+遍历滑窗的方式，逐尺度逐位置判断"这个尺度的这个位置处有没有认识的目标"，非常笨重耗时，并不能很好的推广适用。

现状：

近期顶尖(SOTA)的目标检测方法几乎都用了anchor技术

作用：

首先预设一组不同尺度不同位置的固定参考框，覆盖几乎所有位置和尺度，每个参考框负责检测与其交并比大于阈值 (训练预设值，常用0.5或0.7) 的目标，anchor技术将问题转换为"这个固定参考框中有没有认识的目标，目标框偏离参考框多远"，不再需要多尺度遍历滑窗，真正实现了又好又快，如在Faster R-CNN和SSD两大主流目标检测框架及扩展算法中anchor都是重要部分。

举例：

1.预设anchor
目标检测 anchor 理解笔记

2.识别结果与预设anchor的IOU计算
目标检测 anchor 理解笔记

如按照上图所示，计算所有红色与绿色的IOU（交并比），根据阈值来过滤掉我们需要的后，可能如下图所示：
目标检测 anchor 理解笔记
蓝色部分为符合阈值剩余的部分。
当然在实际中存在一些其他的问题来辅助最后的预算，比如非极大值抑制（NMS）来挑选一个置信度最高的相似目标。

注意：

上图的示例仅仅是一个示例
真实的anchor应该参考如下图的方式：
目标检测 anchor 理解笔记

b图中，生成的anchor为：\(8*8*(预设anchor数量)\)
c图中，生成的anchor为：\(4*4*(预设anchor数量)\)

以上为我根据查找的资料观摩后的个人理解
并没有去深究代码实现和论文
仅供参考
如果理解有误，希望您能不吝赐教。

参考

https://zhuanlan.zhihu.com/p/55824651

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：目标检测 anchor 理解笔记 - Python技术站

人工智能目标检测

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

目标检测非极大值抑制（Non-Maximum Suppression，NMS）

上一篇 2023年4月7日

【50】目标检测之目标定位

下一篇 2023年4月7日

mask_rcnn（Keras+TensorFlow）环境搭建_新手向（毕业设计使用，亲测可用）

但是从GitHub上下载源码的速度非常慢，所以我们从码云上下载，这是GitHub的中国镜像。链接如下：https://gitee.com/mirrors/Mask_RCNN?_from=gitee_search 下载pycocotools 什么需要安装pycocotools，经过看源码发现，训练coco数据集时用到了pycocotools这个模块，如果不安装…

Keras 2023年4月8日
000
深度学习原理与框架-图像补全(原理与代码) 1.tf.nn.moments(求平均值和标准差) 2.tf.control_dependencies(先执行内部操作) 3.tf.cond(判别执行前或后函数) 4.tf.nn.atrous_conv2d 5.tf.nn.conv2d_transpose(反卷积) 7.tf.train.get_checkpoint_state(判断sess是否存在

1. tf.nn.moments(x, axes=[0, 1, 2]) # 对前三个维度求平均值和标准差，结果为最后一个维度，即对每个feature_map求平均值和标准差参数说明：x为输入的feature_map, axes=[0, 1, 2] 对三个维度求平均，即每一个feature_map都获得一个平均值和标准差 2.with tf.control…

卷积神经网络 2023年4月7日
000
tensorflow

Google TensorFlow深度学习笔记

Google 深度学习笔记由于谷歌机器学习教程更新太慢，所以一边学习Deep Learning教程，经常总结是个好习惯，笔记目录奉上。 Github工程地址：https://github.com/ahangchen/GDLnotes 欢迎star，有问题可以到Issue区讨论官方教程地址视频/字幕下载最近tensorflow团队出了一个model项目…

2023年4月8日
000
AI测试101：测试AI系统的实用技巧&ML和AI自动化工具

基于人工智能的系统，也称为神经网络（NN Neural Networks），和其他应用程序一样是 “系统”，因此需要测试。本文将指导你测试AI和基于NN的系统，并理解相关概念。测试人工智能系统的不同之处是什么？ “传统 “的软件是建立在内部确定的算法基础上的。例如，对于将摄氏度转换为华氏度的系统，它将使用简单的F=1.8C+32公式。人工智能用于 “公式…

人工智能概论 2023年4月19日
000
循环神经网络

自然语言处理入门之路【task11】—— 循环神经网络基础

本系列博客为跟随开源组织Datawhale学习小组的学习过程记录，任务内容及相关数据集为Datawhale开源组织搜集并无偿提供，饮水思源，特此宣传，欢迎关注Datawhale。 RNN的结构。循环神经网络的提出背景、优缺点。着重学习RNN的反向传播、RNN出现的问题（梯度问题、长期依赖问题）、BPTT算法。双向RNN LSTM、GRU的结构、提出背景、优…

2023年4月8日
000
编译caffe-gpu-cuda及cudnn-tar 下载地址

y下载 https://github.com/BVLC/caffe https://github.com/BVLC/caffe/archive/master.zip gcc　　 caffe安装有2个问题：1，镜像系统类型，版本要求2，是否使用cudnn(gpu) caffe要调用cudnn部分文件编译 (如用，cuda cudnn版本要求) ubuntu…

Caffe 2023年4月7日
000
循环神经网络

深度学习三人行(第13期)—-初识循环神经网络(RNN)

前段时间，一直在项目中玩CNN，学到了不少，也理解了不少，包括各种经典的CNN网络框架以及改进，然而，RNN的学习并没有项目驱动，这也是为什么搁置了一段时间的原因，但是RNN作为深度学习知识系统的一个重要组成部分，肯定是要学习的。截至上期，我们一起学习了深度学习中卷积神经网络的相关知识，深度学习三人行(第12期)—-CNN经典网络之ResNet 从这…

2023年4月8日
000
[Caffe] ubuntu14.04下使用OpenBLAS加速Caffe

sudo apt-get install libopenblas-dev 二、手动从source安装 1. 下载OpenBLAS并编译 1 git clone https://github.com/xianyi/OpenBLAS.git 2 cd OpenBLAS 3 make -j8 4 sudo make PREFIX=/usr/loca…

Caffe 2023年4月6日
000

合作推广

合作推广

返回顶部