基于深度学习的目标检测算法：SSD

2023年4月8日上午9:25 • 目标检测

主要的思想是：

SSD 是基于一个前向传播 CNN 网络，产生一系列固定大小（fixed-size）的 bounding boxes，以及每一个 box 中包含物体实例的可能性，即 score。之后，进行一个非极大值抑制Non-maximum suppression得到最终的 predictions。

基于深度学习的目标检测算法：SSD

本文添加了额外辅助的网络结构

1. Mult-scale feature map for detection

在base network后，添加一些卷积层，这些层的大小逐渐减小，可以进行多尺度预测

2. Convolutional predictors for detection

每一个新添加的层，可以使用一系列的卷积核进行预测。对于一个大小为m*n、p通道的特征层，使用3*3的卷积核进行预测，在某个位置上预测出一个值，该值可以是某一类别的得分，也可以是相对于default bounding boxes的偏移量，并且在图像的每个位置都将产生一个值，如图2所示。

3. Default boxes and aspect ratio

在特征图的每个位置预测K个box。对于每个box，预测C个类别得分，以及相对于default bounding box的4个偏移值，这样需要(C+4)*k个预测器，在m*n的特征图上将产生(C+4)*k*m*n个预测值。这里，default bounding box类似于FasterRCNN中anchors，如图1所示。

这里的 default box 很类似于 Faster R-CNN 中的 Anchor boxes，关于这里的 Anchor boxes，详细的参见原论文。但是又不同于 Faster R-CNN 中的，本文中的 Anchor boxes 用在了不同分辨率的 feature maps 上。

参考文献：

https://blog.csdn.net/u013989576/article/details/73439202/

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：基于深度学习的目标检测算法：SSD - Python技术站

人工智能目标检测

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

基于tensorflow的目标检测fine-tuning（使用自己标注的图像）

上一篇 2023年4月8日上午9:25

目标检测概念及其经典模型介绍

下一篇 2023年4月8日上午9:25

如何评价Petuum分布式机器学习系统？

机器学习算法和计算机领域的其他算法相比，有自己的一些独特特点，（1）迭代性：模型的更新并非一次完成，需要循环迭代多次；（2）容错性：即使在每个循环中产生一些错误，模型最终的收敛不受影响；（3）参数收敛的非均匀性：模型中有些参数经过几个循环便不再改变，其他参数需要很长时间收敛。这些特点决定了分布式机器学习系统的设计和其他分布式计算系统（例如Spark…

机器学习 2023年4月11日
000
【动手学深度学习】第四章笔记：多层感知机、权重衰减、暂退法、数值稳定性和模型初始化、环境和分布偏移

为了更好的阅读体验，请点击这里 4.1 多层感知机 4.1.1 隐藏层由于仿射变换中的线性是一个很强的假设，因此导致了线性模型可能会不适用。线性意味着单调假设：任何特征的增大都会导致模型输出的增大或者模型输出的减小。但是违反单调性的例子比比皆是。除此之外，分类任务中，仅依托像素强度分类也很不合理。由于任何像素的重要性都以复杂的方式取决于该像素周围的值。对…

人工智能概论 2023年4月25日
000
Caffe

Caffe深度学习计算框架

Caffe | Deep Learning Framework是一个清晰而高效的深度学习框架，其作者是博士毕业于UC Berkeley的 Yangqing Jia，目前在Google工作。Caffe是纯粹的C++/CUDA架构，支持命令行、Python和MATLAB接口；可以在CPU和GPU直接无缝切换： 1 Caffe::set_mode(Caffe::G…

2023年4月6日
000
卷积神经网络

【深度学习】经典的卷积神经网络（LeNet、AlexNet、VGG）

LeNet-5 LeNet-5网络结构来源于Yan LeCun提出的,原文为《Gradient-based learning applied to document recognition》，论文里使用的是mnist手写数字作为输入数据（32 * 32）进行验证。我们来看一下网络结构。 LeNet-5一共有8层: 1个…

2023年4月8日
000
[机器学习]信息&熵&信息增益

关于对信息、熵、信息增益是信息论里的概念，是对数据处理的量化，这几个概念主要是在决策树里用到的概念，因为在利用特征来分类的时候会对特征选取顺序的选择，这几个概念比较抽象，我也花了好长时间去理解(自己认为的理解),废话不多说，接下来开始对这几个概念解释，防止自己忘记的同时，望对其他人有个借鉴的作用，如有错误还请指出。 1、信息这个是熵和信息增益的基础概念，我…

机器学习 2023年4月12日
000
PyTorch

PyTorch DataLoader()使用

DataLoader的作用：通常在训练时我们会将数据集分成若干小的、随机的batch，这个操作当然可以手动操作，但是PyTorch里面为我们提供了API让我们方便地从dataset中获得batch，DataLoader就是干这事儿的。先看官方文档的描述，包括了每个参数的定义：它的本质是一个可迭代对象，一般的操作是：创建一个dataset对象创建一个Dat…

2023年4月6日
000
Tensorflow小技巧：TF_CPP_MIN_LOG_LEVEL

#pythonimport os import tensorflow as tf os.environ[‘TF_CPP_MIN_LOG_LEVEL’] = ‘2’ # or any {‘0’, ‘1’, ‘3’} #C++: (In Terminal) export TF_CPP_MIN_LOG_LEVEL=2 TF_CPP_MIN_LOG_LEVEL默认值…

tensorflow 2023年4月7日
000
tensorflow

tensorflow serving

1.安装tensorflow serving 1.1确保当前环境已经安装并可运行tensorflow 从github上下载源码 git clone –recurse-submodules https://github.com/tensorflow/serving 进入到serving目录下的tensorflow运行./config…

2023年4月6日
000

合作推广

合作推广

返回顶部