CNN:卷积输出分辨率计算

2023年4月5日下午10:39 • 卷积神经网络

卷积是CNN非常核心的操作，CNN主要就是通过卷积来实现特征提取的，在卷积操作的计算中会设计到几个概念：步长(strides)、补充(padding)、卷积核(kernel)等，那卷积的输出分辨率计算一般就会与这几个参数有关(空洞或者扩张卷积暂时不纳入这个范围)，以下计算不做说明的话，均考虑卷积核大小为3*3。所以这一篇就以二维卷积为例子简单记录下卷积的一点计算公式。

以下以s代表步长，p代表补充，k代表卷积核、i代表输入分辨率、o代表输出分辨率,[]代表向下取整(因为公式编辑器里找不到向下取整的符号，以此代替)：

CNN:卷积输出分辨率计算

这一种比较简单，输出为输入减去卷积核加1：

CNN:卷积输出分辨率计算

二、padding=half(same)、strides=1

CNN:卷积输出分辨率计算

这种情况是指补充的大小为卷积核一半，即：

CNN:卷积输出分辨率计算

输出的计算为：

CNN:卷积输出分辨率计算

也就是说，此时的输出是等于输入尺寸的。

三、padding=full

CNN:卷积输出分辨率计算

这种情况是指padding的大小等于k-1,步长为1：

CNN:卷积输出分辨率计算

四、padding=0,strides!=1

CNN:卷积输出分辨率计算

这种情况下，不做补充，但是步长是任意取的，计算公式如下：

CNN:卷积输出分辨率计算

五、padding!=0，strides!=1

CNN:卷积输出分辨率计算

输出为：

CNN:卷积输出分辨率计算

参考

[1] Dumoulin V, Visin F. A guide to convolution arithmetic for deep learning[J]. 2016.

你不愿意种花

你说：

“我不愿看见它一点点凋落”

是的

为了避免结束

您避免了一切开始

-- 顾城

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：CNN:卷积输出分辨率计算 - Python技术站

人工智能卷积神经网络

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

【Vivado HLS Coding Style-2】2维卷积：算法优化

上一篇 2023年4月5日下午10:39

经典网络LeNet5看卷积神经网络各层的维度变化

下一篇 2023年4月5日下午10:39

机器学习 —— 概率图模型（Homework: Exact Inference）

　　在前三周的作业中，我构造了概率图模型并调用第三方的求解器对器进行了求解，最终获得了每个随机变量的分布（有向图），最大后验分布（双向图）。本周作业的主要内容就是自行编写概率图模型的求解器。实际上，从根本上来说求解器并不是必要的。其作用只是求取边缘分布或者MAP，在得到联合CPD后，寻找联合CPD的最大值即可获得MAP，对每个变量进行边缘分布求取即可获得边缘…

机器学习 2023年4月16日
000
【机器学习】Cross-Validation（交叉验证）详解

本文章部分内容基于之前的一篇专栏文章：统计学习引论在机器学习里，通常来说我们不能将全部用于数据训练模型，否则我们将没有数据集对该模型进行验证，从而评估我们的模型的预测效果。为了解决这一问题，有如下常用的方法： 1.The Validation Set Approach 第一种是最简单的，也是很容易就想到的。我们可以把整个数据集分成两部分，一部分用于训练，一…

机器学习 2023年4月10日
000
卷积神经网络

OpenCV-C++ 图像卷积计算的边缘问题

目录卷积边缘问题卷积边缘问题图像在执行卷积计算的时候,图像边缘的像素无法被计算,边缘无法被卷积核正确覆盖; BORDER_DEFAULT BORDER_CONSTANT: 填充边缘用指定像素值; BORDER_REPLICATE: 填充边缘像素用已知的边缘像素值; BORDER_WRAP: 用另外一遍的像素来补偿填充; 使用copyMakeBorder…

2023年4月6日
000
循环神经网络

循环神经网络中BFTT的公式推导

一、变量定义　　此文是我学习BFTT算法的笔记，参考了雷明《机器学习与应用》中的BFTT算法推导，将该本书若干个推导串联起来，下列所有公式都是结合书和资料，手动在PPT上码的，很费时间，但是也加深了自己的理解。　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　二、几个预备知识　　（1）乘法⊙为向量对应元素相乘　…

2023年4月5日
000
目标检测

多尺度目标检测 Multiscale Object Detection

多尺度目标检测 Multiscale Object Detection 我们在输入图像的每个像素上生成多个锚框。这些定位框用于对输入图像的不同区域进行采样。但是，如果锚定框是以图像的每个像素为中心生成的，很快就会有太多的锚框供我们计算。例如，我们假设输入图像的高度和宽度分别为561和728像素。如果以每个像素为中心生成五个不同形状的锚框，则超过两百万个锚框(…

2023年4月6日
000
PyTorch

Linux下PyTorch安装的方法是什么

这篇文章主要讲解了“Linux下PyTorch安装的方法是什么”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“Linux下PyTorch安装的方法是什么”吧！一、PyTorch简介 PyTorch是一个开源的Python机器学习库，基于Torch，用于自然语言处理等应用程序。2017年1月，由Facebook…

2023年4月5日
000
Python 最简实现逻辑回归，针对二维数据进行机器学习

话不多说，直接上代码 1 ”’ 2 logistic regression 3 ”’ 4 5 #导入需要的包 6 import pandas as pd 7 #建立数据集 8 from collections import OrderedDict 9 #是否通过考试用0和1表示，0表示未通过，1表示通过。 10 examDict={‘学习时间’:[0.5…

机器学习 2023年4月16日
000
目标检测

目标检测的重点

1.Hourglass 本文使用全卷积神经网络，对给定的单张RGB图像，输出人体关键点的精确像素位置，使用多尺度特征，捕捉人体各关节点的空间位置信息。网络结构形似沙漏状，重复使用top-down到bottom-up来推断人体的关节点位置。每一个top-down到bottom-up的结构都是一个stacked hourglass模块中继结构进行loss监督 …

2023年4月8日
000

合作推广

合作推广

返回顶部