关于1*1卷积核的理解

2023年4月8日上午9:56 • 卷积神经网络

yizhihongxing

发现很多网络使用1×1的卷积核，实际就是对输入的一个比例缩放，因为1×1卷积核只有一个参数，这个核在输入上滑动，就相当于给输入数据乘以一个系数。（对于单通道和单个卷积核而言这样理解是可以的）

对于多通道和多个卷积核的理解，1×1卷积核大概有两方面的作用：
1.实现跨通道的交互和信息整合（具有线性修正特性，实现多个feature map的线性组合，可以实现feature map在通道个数上的变化，想象成跨通道的pooling，(输入的多通道的feature map和一组卷积核做卷积求和得到一个输出的feature map)
2.进行卷积核通道数的降维和升维（同时还具有降维或者升维功能）
3.在pooling层后面加入的1×1的卷积也是降维，使得最终得到更为紧凑的结构，虽然有22层，但是参数数量却只是alexnet的1/12.
4.最近大热的MSRA的resnet也利用了1×1的卷积，并且是在3×3卷积层的前后都使用了，不仅进行了降维，还进行了升维，使得卷积层的输入和输出的通道数都减小，数量进一步减少。如果1×1卷积核接在普通的卷积层后面，配合激活函数，就可以实现network in network的结构了。
5.还有一个很重要的功能，就是可以在保持feature map尺度不变的（即不损失分辨率）的前提下大幅增加非线性特性（利用后接的非线性激活函数），把网络做的很deep。（平均池化是针对每个feature map的平均操作，没有通道间的交互，而1×1卷积是对通道的操作，在通道的维度上进行线性组合）

一个filter对应卷积后得到一个feature map

不同的filter(不同的weight和bias)，卷积以后得到不同的feature map，提取不同的特征，得到对应的specialized neuro。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：关于1*1卷积核的理解 - Python技术站

人工智能卷积神经网络

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

TensorFlow conv2d实现卷积

上一篇 2023年4月8日

卷积与反卷积以及步长stride

下一篇 2023年4月8日

Python_sklearn机器学习库学习笔记（一）_Feature Extraction and Preprocessing(特征提取与预处理）

　　# Extracting features from categorical variables #Extracting features from categorical variables 独热编码 from sklearn.feature_extraction import DictVectorizer onehot_encoder=DictVec…

机器学习 2023年4月10日
000
目标检测

(转)如何用TensorLayer做目标检测的数据增强

数据增强在机器学习中的作用不言而喻。和图片分类的数据增强不同，训练目标检测模型的数据增强在对图像做处理时，还需要对图片中每个目标的坐标做相应的处理。此外，位移、裁剪等操作还有可能使得一些目标在处理后只有一小部分区域保留在原图中，这需要额外的机制来判断是否需要去掉该目标来训练模型。为此TensorLayer 1.7.0（tf>=1.4 &&amp…

2023年4月6日
000
机器学习中的生成模式和判别模式

参考网址：http://blog.163.com/huai_jing@126/blog/static/1718619832011227757554/ 常见的生成式模型判别式分析朴素贝叶斯Native Bayes 混合高斯型Gaussians K近邻KNN 隐马尔科夫模型HMM 贝叶斯网络 sigmoid belief networks 马尔科夫随机场Ma…

机器学习 2023年4月13日
000
卷积神经网络

卷积神经网络之VGG网络模型学习

VGG:VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION 牛津大学 visual geometry group（VGG）Karen Simonyan 和Andrew Zisserman 于14年发表的论文。论文地址：https://arxiv.org/pdf/1409.155…

2023年4月6日
000
周志华-机器学习西瓜书-第三章习题3.5 LDA

本文为周志华机器学习西瓜书第三章课后习题3.5答案，编程实现线性判别分析LDA，数据集为书本第89页的数据首先介绍LDA算法流程： LDA的一个手工计算数学实例：课后习题的代码： # coding=utf-8# import flattenimport tensorflow as tffrom numpy import *import numpy…

机器学习 2023年4月12日
000
机器学习之杂乱笔记

https://tensorflow.google.cn/tutorials/representation/word2vec 暂时我们使用 vanilla 定义，将“上下文”定义为目标字词左侧和右侧的字词窗口通过噪声对比训练进行扩展神经概率语言模型一直以来都使用最大似然率 (ML) 原则进行训练，以最大限度地提高使用 softmax 函数根据之前的字…

机器学习 2023年4月13日
000
TensorFlow2.0——划分数据集

将数据划分成若干批次的数据，可以使用tf.train或者tf.data.Dataset中的方法。（1）划分方法 # 下面是，数据批次划分 batch_size = 10 # 将训练数据的特征和标签组合，使用from_tensor_slices将数据放入队列 dataset = tfdata.Dataset.from_tensor_slices((featu…

tensorflow 2023年4月7日
000
卷积神经网络

【深度学习】CNN 中 1×1 卷积核的作用

最近研究 GoogLeNet 和 VGG 神经网络结构的时候，都看见了它们在某些层有采取 1×1 作为卷积核，起初的时候，对这个做法很是迷惑，这是因为之前接触过的教材的例子中最小的卷积核是 3×3 ，那么，1×1 的卷积核有什么意义呢？最初应用 1×1 卷积核的神经网络是 Network In Network，然后 GoogLeNet 和 VGG 也不约而…

2023年4月6日
000

合作推广

合作推广

返回顶部