InceptionNet提出了1×1卷积核

2023年4月8日上午12:51 • 卷积神经网络

1.Inceptionnet的借鉴点

Inception结构快在同一层网络中使用多个尺寸的卷积核，可以提取不同尺寸的特征，提升感知力（通过 padding 实现输出特征面积一致）；使用 1 * 1 卷积核，作用到输入特征图的每个像素点，通过设定少于输入特征图深度的1*1卷积核的个数，减少了输出特征图的深度，起到了降维的作用，减少了参数量和计算量，即改变输出特征 channel 数（减少网络参数）。

InceptionNet 即 GoogLeNet，诞生于 2015 年，旨在通过增加网络的宽度来提升网络的能力，与 VGGNet 通过卷积层堆叠的方式（纵向）相比，是一个不同的方向（横向）。

显然，InceptionNet 模型的构建与 VGGNet 及之前的网络会有所区别，不再是简单的纵向堆叠，要理解 InceptionNet 的结构，首先要理解它的基本单元，如图 5-27 所示。

InceptionNet提出了1x1卷积核

2.实现

InceptionNet提出了1x1卷积核

四个分支送到卷积连接器的特征数据尺寸相同，卷积连接器会把收到的这四路特征数据按深度方向拼接，形成Inception结构块的输出

由于都是使用CBA的结构，直接定义一个ConvRelu类

InceptionNet提出了1x1卷积核

x1, x2_1, x2_2, x3_1, x3_2, x4_1, x4_2是四个分支的输出，使用tf.concat函数将它们按深度方向堆叠在一起，axis=3指定堆叠的维度是按深度方向

3.1*1的卷积运算是如何降低特征厚度的呢？（减小参数量）

下面以5 * 5的卷积运算为例说明这个问题。假设网络上一层的输出为 100 * 100 * 128（H * W * C），通过 32 * 5 * 5（32 个大小为 5 * 5 的卷积核）的卷积层（步长为 1、全零填充）后，输出为 100 * 100 * 32，卷积层的参数量为 32 * 5 * 5 * 128 = 102400；

如果先通过 32 * 1 * 1 的卷积层（输出为 100 * 100 * 32），再通过 32 * 5 * 5 的卷积层，输出仍为 100 * 100 * 32，但卷积层的参数量变为 32 * 1 * 1 * 128+ 32 * 5 * 5 * 32 = 29696，仅为原参数量的 30 %左右，这就是小卷积核的降维作用

InceptionNet提出了1x1卷积核

为什么经过卷积核后图片大小不变？

因为是全0填充的。

InceptionNet提出了1x1卷积核

参数 num_blocks 代表 InceptionNet 的 Block 数，每个 Block 由两个基本单元构成，每经过一个 Block，特征图尺寸变为 1/2，通道数变为 2 倍； num_classes 代表分类数，对于 cifar10数据集来说即为 10； init_ch 代表初始通道数，也即 InceptionNet 基本单元的初始卷积核个数。

InceptionNet 网络不再像 VGGNet 一样有三层全连接层（全连接层的参数量占 VGGNet总参数量的 90 %），而是采用“全局平均池化+全连接层”的方式，这减少了大量的参数。

这里介绍一下全局平均池化，在 tf.keras 中用 GlobalAveragePooling2D 函数实现，相比于平均池化（在特征图上以窗口的形式滑动，取窗口内的平均值为采样值），全局平均池化不再以窗口滑动的形式取均值，而是直接针对特征图取平均值，即每个特征图输出一个值。通过这种方式，每个特征图都与分类概率直接联系起来，这替代了全连接层的功能，并且不产生额外的训练参数，减小了过拟合的可能，但需要注意的是，使用全局平均池化会导致网络收敛的速度变慢。

总体来看， InceptionNet 采取了多尺寸卷积再聚合的方式拓宽网络结构，并通过 1 * 1的卷积运算来减小参数量，取得了比较好的效果，与同年诞生的 VGGNet 相比，提供了卷积神经网络构建的另一种思路。但 InceptionNet 的问题是，当网络深度不断增加时，训练会十分困难，甚至无法收敛（这一点被 ResNet 很好地解决了）。

InceptionNet提出了1x1卷积核

4.代码

import tensorflow as tf
import os
import numpy as np
from matplotlib import pyplot as plt
from tensorflow.keras.layers import Conv2D, BatchNormalization, Activation, MaxPool2D, Dropout, Flatten, Dense, 
    GlobalAveragePooling2D
from tensorflow.keras import Model

np.set_printoptions(threshold=np.inf)

cifar10 = tf.keras.datasets.cifar10
(x_train, y_train), (x_test, y_test) = cifar10.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0


class ConvBNRelu(Model):
    def __init__(self, ch, kernelsz=3, strides=1, padding='same'):
        super(ConvBNRelu, self).__init__()
        self.model = tf.keras.models.Sequential([
            Conv2D(ch, kernelsz, strides=strides, padding=padding),
            BatchNormalization(),
            Activation('relu')
        ])

    def call(self, x):
        x = self.model(x, training=False) #在training=False时，BN通过整个训练集计算均值、方差去做批归一化，training=True时，通过当前batch的均值、方差去做批归一化。推理时 training=False效果好
        return x


class InceptionBlk(Model):
    def __init__(self, ch, strides=1):
        super(InceptionBlk, self).__init__()
        self.ch = ch
        self.strides = strides
        self.c1 = ConvBNRelu(ch, kernelsz=1, strides=strides)
        self.c2_1 = ConvBNRelu(ch, kernelsz=1, strides=strides)
        self.c2_2 = ConvBNRelu(ch, kernelsz=3, strides=1)
        self.c3_1 = ConvBNRelu(ch, kernelsz=1, strides=strides)
        self.c3_2 = ConvBNRelu(ch, kernelsz=5, strides=1)
        self.p4_1 = MaxPool2D(3, strides=1, padding='same')
        self.c4_2 = ConvBNRelu(ch, kernelsz=1, strides=strides)

    def call(self, x):
        x1 = self.c1(x)
        x2_1 = self.c2_1(x)
        x2_2 = self.c2_2(x2_1)
        x3_1 = self.c3_1(x)
        x3_2 = self.c3_2(x3_1)
        x4_1 = self.p4_1(x)
        x4_2 = self.c4_2(x4_1)
        # concat along axis=channel
        x = tf.concat([x1, x2_2, x3_2, x4_2], axis=3)
        return x


class Inception10(Model):
    def __init__(self, num_blocks, num_classes, init_ch=16, **kwargs):
        super(Inception10, self).__init__(**kwargs)
        self.in_channels = init_ch
        self.out_channels = init_ch
        self.num_blocks = num_blocks
        self.init_ch = init_ch
        self.c1 = ConvBNRelu(init_ch)
        self.blocks = tf.keras.models.Sequential()
        for block_id in range(num_blocks):
            for layer_id in range(2):
                if layer_id == 0:
                    block = InceptionBlk(self.out_channels, strides=2)
                else:
                    block = InceptionBlk(self.out_channels, strides=1)
                self.blocks.add(block)
            # enlarger out_channels per block
            self.out_channels *= 2
        self.p1 = GlobalAveragePooling2D()
        self.f1 = Dense(num_classes, activation='softmax')

    def call(self, x):
        x = self.c1(x)
        x = self.blocks(x)
        x = self.p1(x)
        y = self.f1(x)
        return y


model = Inception10(num_blocks=2, num_classes=10)

model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),
              metrics=['sparse_categorical_accuracy'])

checkpoint_save_path = "./checkpoint/Inception10.ckpt"
if os.path.exists(checkpoint_save_path + '.index'):
    print('-------------load the model-----------------')
    model.load_weights(checkpoint_save_path)

cp_callback = tf.keras.callbacks.ModelCheckpoint(filepath=checkpoint_save_path,
                                                 save_weights_only=True,
                                                 save_best_only=True)

history = model.fit(x_train, y_train, batch_size=32, epochs=5, validation_data=(x_test, y_test), validation_freq=1,
                    callbacks=[cp_callback])
model.summary()

# print(model.trainable_variables)
file = open('./weights.txt', 'w')
for v in model.trainable_variables:
    file.write(str(v.name) + 'n')
    file.write(str(v.shape) + 'n')
    file.write(str(v.numpy()) + 'n')
file.close()

###############################################    show   ###############################################

# 显示训练集和验证集的acc和loss曲线
acc = history.history['sparse_categorical_accuracy']
val_acc = history.history['val_sparse_categorical_accuracy']
loss = history.history['loss']
val_loss = history.history['val_loss']

plt.subplot(1, 2, 1)
plt.plot(acc, label='Training Accuracy')
plt.plot(val_acc, label='Validation Accuracy')
plt.title('Training and Validation Accuracy')
plt.legend()

plt.subplot(1, 2, 2)
plt.plot(loss, label='Training Loss')
plt.plot(val_loss, label='Validation Loss')
plt.title('Training and Validation Loss')
plt.legend()
plt.show()

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：InceptionNet提出了1×1卷积核 - Python技术站

人工智能卷积神经网络

0 0 打赏

微信扫一扫

支付宝扫一扫

感受野（Receptive Field）理解为什么采用多层小卷积核来替换一层大卷积核

上一篇 2023年4月8日上午12:51

卷积及其应用

下一篇 2023年4月8日上午12:51

循环神经网络

Recurrent Neural Networks(RNN) 循环神经网络初探

0x1：数据规律的本质是能代表此类数据的通用模式 – 数据挖掘的本质是在进行模式提取数据的本质是存储信息的介质，而模式（pattern）是信息的一种表现形式。在一个数据集中，模式有很多不同的表现形式，不管是在传统的机器学习训练的过程，还是是深度学习的训练过程，本质上都是在进行模式提取。而从信息论的角度来看，模式提取也可以理解为一种信息压缩过程，通过将信息…

2023年4月6日
000
Keras

拓端tecdat|TensorFlow 2.0 keras开发深度学习模型实例：多层感知器（MLP），卷积神经网络（CNN）和递归神经网络（RNN）

原文链接：http://tecdat.cn/?p=15850 在本部分中，您将发现如何使用标准深度学习模型（包括多层感知器（MLP），卷积神经网络（CNN）和递归神经网络（RNN））开发，评估和做出预测。开发多层感知器模型多层感知器模型（简称MLP）是标准的全连接神经网络模型。它由节点层组成，其中每个节点连接到上一层的所有输出，每个节点的输出连接到下一…

2023年4月8日
000
循环神经网络

TensorFlow（三）循环神经网络

TensorFlow循环神经网络为什么有RNN CNN(卷积神经网络)我们会发现, 他们的输出都是只考虑前一个输入的影响而不考虑其它时刻输入的影响, 比如简单的猫,狗,手写数字等单个物体的识别具有较好的效果. 但是, 对于一些与时间先后有关的, 比如视频的下一时刻的预测,文档前后文内容的预测等, 这些算法的表现就不尽如人意了.因此, RNN就应运而生了什…

2023年4月8日
000
Keras

拓端数据tecdat|使用Python中Keras的LSTM递归神经网络进行时间序列预测

时间序列预测问题是预测建模问题中的一种困难类型。与回归预测建模不同，时间序列还增加了输入变量之间序列依赖的复杂性。用于处理序列依赖性的强大神经网络称为递归神经网络。长短期记忆网络或LSTM网络是深度学习中使用的一种递归神经网络，可以成功地训练非常大的体系结构。在本文中，您将发现如何使用Keras深度学习库在Python中开发LSTM网络，以解决时…

2023年4月8日
000
Keras

注意力机制及Keras实现

注意力往往与encoder-decoder（seq2seq）框架搭在一起，假设我们编码前与解码后的序列如下：编码时，我们将source通过非线性变换到中间语义：则我们解码时，第i个输出为：可以看到，不管i为多少，都是基于相同的中间语义C进行解码的，也就是说，我们的注意力对所有输出都是相同的。所以，注意力机制的任务就是突出重点，也就…

2023年4月8日
000
目标检测

目标检测论文解读12——RetinaNet

引言　　这篇论文深刻分析了one-stage的模型精度比two-stage更差的原因，并提出Focal Loss提高精度。思路　　在论文中，作者指出，造成one-stage模型精度差的原因主要是：正负样本极不平衡。一张图片只有那么几个目标，但是用来分类的Anchor Box却能达到几千个，大量的样本都是负样本，而且大多数负样本都是容易分类的简单样本，这…

2023年4月8日
000
机器学习

【机器学习基础】集成学习回顾及总结

之前有将集成学习中的随机森林、GBDT、XGBoost等算法进行一一介绍，明白了每个算法的大概原理，最近复习了一下李宏毅老师的集成学习的课程，忽然对集成有了更清晰的认识，这里做一个回顾和总结。集成学习回顾及总结集成学习从直观的意思来说，就是合众人之力来解决一个问题，而每个人所起的作用又不相同，最终把大家的力量进行“集成”，从而得到更优的方案。在前面线性…

2023年4月17日
000
Keras

Blackey win10 + python3.6 + VSCode + tensorflow-gpu + keras + cuda8 + cuDN6N环境配置（转载）

win10 + python3.6 + VSCode + tensorflow-gpu + keras + cuda8 + cuDN6N环境配置写在前面的话：　　再弄这个之前，我对python也好，tensorflow也好几乎是0认知的，所以配置这个环境的时候，走了不少弯路，整整耗费了一个星期的时间才搭配完整这个环境，简直了。。。然而最气的是，好不容…

2023年4月6日
000

InceptionNet提出了1×1卷积核

相关文章