keras学习记录——resnet为什么用averagepooling？

2023年4月8日上午11:33 • Keras

keras学习记录——resnet为什么用averagepooling？

目录

keras学习记录——resnet为什么用averagepooling？

一、池化层

二、为什么在resnet后加均值池化而不是最大池化？

三、实际测试

前言

本篇主要讨论resnet最后的pooling层为什么用averagepooling,而不是maxpooling?

主要用实验来回答这个问题，另外讲解了averagepooling和maxpooling的优缺点，并做了一些猜测（科研需要猜测，哈哈）

一、池化层

主要分为两种：averagepooling和maxpooling。

最大池化提取边缘等“最重要”的特征，而平均池化提取的特征更加smoothly。对于图像数据，你可以看到差异。虽然两者都是出于同样的原因使用，但我认为max pooling更适合提取极端功能。平均池有时不能提取好的特征，因为它将全部计入并计算出平均值，这对于对象检测类型任务可能不好用。引自：最大池化和均值池化的优缺点

二、为什么在resnet后加均值池化而不是最大池化？

猜测1：提取全局信息时适用于averagepooling，如分类；而提取局部信息时适用maxpooling,如roi pooling。

猜测2：在pooling层后面直接接上全连接层，全连接层在训练时是比较容易过拟合的，而averagepooling可以起到正则化的作用，正好可以防止过拟合。

猜测3：resnet不是采用传统的连通层进行CNN分类，而是设置了一些特别的通路将特征相加起来，因此看起来平均或许能更好的提取所需特征。

三、实际测试

本博客使用本人之前的博客中提到的网络，若有兴趣请转keras学习记录——训练resnet模型对cifar10分类，分别以averagepooling和maxpooling做训练，得出实验数据。

图中0_acc和0_vla_acc分别为averagepooling对应的训练集和验证集的准确率，case0_acc和case0_vla_acc分别为maxpooling对应的训练集和验证集的准确率。由图可知，在resnet中averagepooling相较于maxpooling，效果要好。

keras学习记录——resnet为什么用averagepooling？

总结

学习了pooling相关的知识，记录下来，发现印象加深了好多，果然好记性不如好博客呀。

另外以后有机会测一下全局均值池化，可能效果比这两个更好。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：keras学习记录——resnet为什么用averagepooling？ - Python技术站

Keras 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

keras 训练中的Acc由来

上一篇 2023年4月8日上午11:33

(Keras/监督学习)15分钟搞定最新深度学习车牌OCR

下一篇 2023年4月8日上午11:34

ubuntu18.04+ cuda9.0+opencv3.1+caffe-ssd安装

详细Ubuntu18.04,CUDA9.0,OpenCV3.1,Tensorflow完全配置指南问题1：使用Cmake编译opencv源码 CMake Error: The following variables are used in this project, but they are set to NOTFOUND. Please set them …

Caffe 2023年4月8日
000
目标检测

YOLO 目标检测P/R/mAP计算方法

常见评价标准如Precision，Recall，AP，mAP的具体计算过程评价指标 True positives: 简称为TP，即正样本被正确识别为正样本，飞机的图片被正确的识别成了飞机。 True negatives: 简称为TN，即负样本被正确识别为负样本，大雁的图片没有被识别出来，系统正确地认为它们是大雁。 False Positives: 简称为F…

2023年4月8日
000
82、TensorFlow教你如何构造卷积层

”’ Created on 2017年4月22日 @author: weizhen ”’ import tensorflow as tf #通过tf.get_variable的方式创建过滤器的权重变量和偏置变量，上面介绍了卷积层 #的参数个数只和过滤器的尺寸、深度以及当前层节点矩阵的深度有关，所以这里声明的参数变量 #是一个四维矩阵，前面两个维度代表了过…

卷积神经网络 2023年4月8日
000
机器学习笔记—-最小二乘法，局部加权，岭回归讲解

前情提要：关于logistic regression，其实本来这章我是不想说的，但是刚看到岭回归了，我感觉还是有必要来说一下。一:最小二乘法最小二乘法的基本思想：基于均方误差最小化来进行模型求解的方法。在线性回归中，最小二乘法就是试图找到一条直线，使所有样本到直线上的欧氏距离之和最小。就是说让你现在追一个女生，你希望女生喜欢你是f(xi),而女生喜欢你的…

机器学习 2023年4月12日
000
Caffe

Blob,Layer and Net以及对应配置文件的编写_caffe

Blob,Layer and Net以及对应配置文件的编写_caffe转自：denny402 http://www.cnblogs.com/denny402/p/5073427.html 深度网络(net)是一个组合模型，它由许多相互连接的层（layers)组合而成。Caffe就是组建深度网络的这样一种工具，它按照一定的策略，一层一层的搭建出自己的模型。它…

2023年4月8日
000
Keras

人工智能深度学习入门练习之（38）深度学习 – tensorflow实例之keras的siamese(孪生网络)实现案例

一、 keras的siamese(孪生网络)实现案例二、代码实现 import keras import numpy as np import matplotlib.pyplot as plt import random from keras.callbacks import TensorBoard from keras.datasets import m…

2023年4月8日
000
TensorFlow安装之后导入报错：libcudnn.so.6:cannot open sharedobject file: No such file or directory

转载自：http://blog.csdn.net/silent56_th/article/details/77587792 系统环境：Ubuntu16.04 + GTX1060 目的：配置一下python-tensorflow环境问题复现：使用设置/软件与更新/附件驱动安装nvidia-375 使用CUDA-8.0*.run安装CUDA 使用cudnn…

tensorflow 2023年4月8日
000
PyTorch

Pytorch迁移学习

环境： Pytorch1.1，Python3.6，win10/ubuntu18，GPU 正文 Pytorch构建ResNet18模型并训练，进行真实图片分类；利用预训练的ResNet18模型进行Fine tune，直接进行图片分类；站在巨人的肩膀上，使用已经在ImageNet上训练好的模型，除了最后一层全连接层，中间层的参数全部迁移到目标模型上，如下图所示…

2023年4月8日
000

合作推广

合作推广

返回顶部