如何设计卷积神经网络架构和卷积、池化后图片大小的计算

2023年4月8日上午9:52 • 卷积神经网络

（1）如何设计卷积神经网络架构

下面的正则化公式总结了一些经典的用于图片分类问题的卷积神经网络架构：

输入层→（卷积层+→池化层？）+→全连接层+

“+”表示一层或多层，“？”表示有或者没有

除了LeNet-5模型，2012年ImageNet ILSVRC图像分类挑战的第一名AlexNet模型、2013年ILSVRC第一名ZF Net模型已经 2014年第二名VGGNet模型的架构都满足上面的正则表达式。

（2）如何设置卷积层或池化层配置

· 过滤器的尺寸：1或3或5，有些网络中有过7甚至11

· 过滤器的深度：逐层递增。每经过一次池化层之后，卷积层深度*2

· 卷积层的步长：一般为1，有些也会使用2甚至3

· 池化层：最多的是max_pooling，过滤器边长一般为2或者3，步长一般为2或3

卷积和池化后图片大小及个数的计算

（1）卷积后图片输出大小几个数

W:图像宽，H:图像高，D:图像深度（通道数）

F：卷积核宽高，N:卷积核（过滤器）个数S:步长，P:用零填充个数

卷积后输出图像大小：

Width=(W-F+2P)/S+1

Height=(H-F+2P)/S+1

卷积后输出图像深度：

D=N

输出图像大小：（width，height，N）

weight个数： F*F*D*N

bias个数： N

总结：卷积输出大小=[（输入大小-卷积核（过滤器）大小+2*P）／步长]+1

（2）池化层

通用的卷积时padding 的选择：

1. 如卷积核宽高为3时 padding 选择1

2. 如卷积核宽高为5时 padding 选择2

3. 如卷积核宽高为7时 padding 选择3

池化后图片输出大小及个数

W:图像宽，H:图像高，D:图像深度（通道数）

F：卷积核宽高，S:步长

池化后输出图像大小：

W=(W-F)/S+1

H=(H-F)/S+1

池化后输出图像深度：

D=N

总结：池化输出大小=[（输入大小-卷积核（过滤器）大小）／步长]+1

参考：https://blog.csdn.net/qian99/article/details/79008053

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：如何设计卷积神经网络架构和卷积、池化后图片大小的计算 - Python技术站

人工智能卷积神经网络

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

【深度学习】经典的卷积神经网络（LeNet、AlexNet、VGG）

上一篇 2023年4月8日上午9:52

[转]tensorflow 中的卷积conv2d的padding 到底要padding多少

下一篇 2023年4月8日

循环神经网络

LSTM循环神经网络理解

1.循环神经网络 A是一组神经网络（可以理解为一个网络的自循环），它的工作是不停的接收并且输出。从图中可以看出A允许将信息不停的再内部循环，这样使得它可以保证每一步的计算都保存以前的信息

2023年4月8日
000
keras 的 Deeplabv3+ 实现遇到的问题

代码大佬都已经写好了，具体参考：https://github.com/bonlime/keras-deeplab-v3-plus git clone 下来以后，按照指南要训练自己的数据集，只要设置好自己的数据大小和类别就可以了 from model import Deeplabv3 deeplab_model = Deeplabv3(input_shape=…

Keras 2023年4月5日
000
100天搞定机器学习|Day3多元线性回归

前情回顾[第二天100天搞定机器学习|Day2简单线性回归分析][1]，我们学习了简单线性回归分析，这个模型非常简单，很容易理解。实现方式是sklearn中的LinearRegression，我们也学习了LinearRegression的四个参数，fit_intercept、normalize、copy_X、n_jobs。然后介绍了LinearRegress…

机器学习 2023年4月13日
000
mmdetection目标检测tricks

参考博客：https://zhuanlan.zhihu.com/p/102817180

目标检测 2023年4月7日
000
卷积神经网络

【DL-2-1】卷积神经网络(CNN)–总体概述

1、目录 2、简述 3、CNN的结构组成 4、卷积神经网络 VS. 传统神经网络 5、总结常见问答二、简述 1980年，一位名为Fukushima的研究员提出了一种分层神经网络模型。他称之为新认知。该模型的灵感来自简单和复杂细胞的概念。neocognitron能够通过了解物体的形状来识别模式。后来，1998年，卷心神经网络被Bengio，Le Cun，…

2023年4月5日
000
Caffe

（原）torch和caffe中的BatchNorm层

转载请注明出处： http://www.cnblogs.com/darkknightzh/p/6015990.html BatchNorm具体网上搜索。 caffe中batchNorm层是通过BatchNorm+Scale实现的，但是默认没有bias。torch中的BatchNorm层使用函数SpatialBatchNormalization实现，该函数中有…

2023年4月8日
000
目标检测

百度视觉团队斩获 ECCV Google AI 目标检测竞赛冠军，获奖方案全解读 | ECCV 2018

https://mp.weixin.qq.com/s/cP2kM553XyRsUZ5xJ8kAZA 以下为百度视觉团队技术方案解读：存在挑战与传统的检测数据集合相比，该赛事除了数据规模大、更真实之外，还存在一系列的挑战。具体来说，主要集中在以下三个方面：数据分布不均衡：最少的类别框选只有 14 个，而最多的类别框选超过了 140w，数据分布严重不均…

2023年4月8日
000
keras 打印模型图

keras中可以使用 from keras.utils import plot_model plot_model(model,to_file=’model_auth.png’,show_shapes=True) #show_shapes=True可以把输入输出的shape一起打印注意，最好是给每个层命名，命名好之后打印出来的才会带名字。程序运行的时候也…

Keras 2023年4月5日
000

合作推广

合作推广

返回顶部