基于深度学习的目标检测算法：SSD

2023年4月8日上午9:25 • 目标检测

主要的思想是：

SSD 是基于一个前向传播 CNN 网络，产生一系列固定大小（fixed-size）的 bounding boxes，以及每一个 box 中包含物体实例的可能性，即 score。之后，进行一个非极大值抑制Non-maximum suppression得到最终的 predictions。

基于深度学习的目标检测算法：SSD

本文添加了额外辅助的网络结构

1. Mult-scale feature map for detection

在base network后，添加一些卷积层，这些层的大小逐渐减小，可以进行多尺度预测

2. Convolutional predictors for detection

每一个新添加的层，可以使用一系列的卷积核进行预测。对于一个大小为m*n、p通道的特征层，使用3*3的卷积核进行预测，在某个位置上预测出一个值，该值可以是某一类别的得分，也可以是相对于default bounding boxes的偏移量，并且在图像的每个位置都将产生一个值，如图2所示。

3. Default boxes and aspect ratio

在特征图的每个位置预测K个box。对于每个box，预测C个类别得分，以及相对于default bounding box的4个偏移值，这样需要(C+4)*k个预测器，在m*n的特征图上将产生(C+4)*k*m*n个预测值。这里，default bounding box类似于FasterRCNN中anchors，如图1所示。

这里的 default box 很类似于 Faster R-CNN 中的 Anchor boxes，关于这里的 Anchor boxes，详细的参见原论文。但是又不同于 Faster R-CNN 中的，本文中的 Anchor boxes 用在了不同分辨率的 feature maps 上。

参考文献：

https://blog.csdn.net/u013989576/article/details/73439202/

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：基于深度学习的目标检测算法：SSD - Python技术站

人工智能目标检测

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

基于tensorflow的目标检测fine-tuning（使用自己标注的图像）

上一篇 2023年4月8日上午9:25

目标检测概念及其经典模型介绍

下一篇 2023年4月8日上午9:25

卷积神经网络之AlexNet网络模型学习卷积神经网络之AlexNet网络模型学习

ImageNet Classification with Deep Convolutional Neural Networks 论文理解在ImageNet LSVRC-2010上首次使用大型深度卷积神经网络，并获得很好的成果。数据集：ILSVRC使用ImageNet的一个子集，1000个类别每个类别大约1000张图像。总计，大约120万训练图像，5…

卷积神经网络 2023年4月6日
000
循环神经网络

tensorflow 基于深度学习循环神经网络 LSTM 识别验证码

1、前期经验关于验证码识别，试过使用传统的machine learning方式识别，在相同样本下效果还算可以，但当迁移到别的数据集时，效果不理想。对于使用深度学习识别验证码，尝试过使用LeNet-5、AlexNet两种卷积网络，可能是网络结构简单的原因，结果不收敛。故尝试用了RNN中的LSTM单元网络来识别，效果较理想。 …

2023年4月8日
001
HMS Core 机器学习服务打造同传翻译新“声”态，AI让国际交流更顺畅

2022年6月，HMS Core机器学习服务面向开发者提供一项全新的开放能力——同声传译，通过AI语音技术减少资源成本，加强沟通交流，旨在帮助开发者制作丰富多样的同声传译应用。 HMS Core同声传译涵盖了机器学习服务的语音识别、翻译、语音合成等核心技术，首先把输入的实时语音转换成文字，然后再把文字翻译成另一种语言的文字，最后把翻译后的文字转换成语音播放。…

机器学习 2023年4月11日
000
循环神经网络

【TensorFlow入门完全指南】神经网络篇·循环神经网络（RNN）

第一步仍然是导入库和数据集。 ”’ To classify images using a reccurent neural network, we consider every image row as a sequence of pixels. Because MNIST image shape is 28*28px, we will then ha…

2023年4月6日
000
Django整合Keras报错：ValueError: Tensor Tensor(“Placeholder:0”, shape=(3, 3, 1, 32), dtype=float32) is not an element of this graph.解决方法

本人在写Django RESful API时，碰到一个难题，老出现，整合Keras,报如下错误；很纠结，探索找资料近一个星期，皇天不负有心人，解决了 Internal Server Error: /pic/analysis/ Traceback (most recent call last): File “D:\AI\Python35\lib\site-…

Keras 2023年4月8日
000
卷积神经网络

【机器学习】卷积层，池化层，全连接层，BN层作用；CNN 网络参数数量的计算

官方文档：https://keras.io/layers/convolutional/#zeropadding2d https://blog.keras.io/building-powerful-image-classification-models-using-very-little-data.html VGG16架构 https://www.cnblog…

2023年4月6日
000
Caffe

Intel Caffe 与原生Caffe

1. 首先安装好docker，拉取intel caffe image: $ docker pull bvlc/caffe:intel 试着运行： $ docker run -it bvlc/caffe:intel /bin/bash 2. 拉取 intel caffe 源码： git clone https://github.com/intel/caffe…

2023年4月6日
000
卷积神经网络

1-8 简单卷积网络示例

简单卷积网络示例（A simple convolution network example）假设你有一张图片，你想做图片分类或图片识别，把这张图片输入定义为，然后辨别图片中有没有猫，用 0 或 1 表示，这是一个分类问题，我们来构建适用于这项任务的卷积神经网络。针对这个示例，我用了一张比较小的图片，大小是 39×39×3，这样设定可以使其中一些数字效果更…

2023年4月8日
000

合作推广

合作推广

返回顶部