《python深度学习》笔记—5.3-3、猫狗分类（使用预训练网络-数据增强的特征提取）

2023年4月13日上午1:03 • 深度学习

一、总结

一句话总结：

其实就是把vgg16对应的conv_base像层一样放到Sequential中，然后对图片进行数据增强即可

model.add(conv_base)

from tensorflow.keras import models 
from tensorflow.keras import layers 
 
model = models.Sequential() 
model.add(conv_base) 
model.add(layers.Flatten()) 
model.add(layers.Dense(256, activation='relu')) 
model.add(layers.Dense(1, activation='sigmoid'))
model.summary()

1、模型的行为和层类似？

向Sequential模型中添加一个模型（比如vgg16）：所以你可以向 Sequential 模型中添加一个模型（比如 conv_base），就像添加一个层一样。

from tensorflow.keras import models 
from tensorflow.keras import layers 
 
model = models.Sequential() 
model.add(conv_base) 
model.add(layers.Flatten()) 
model.add(layers.Dense(256, activation='relu')) 
model.add(layers.Dense(1, activation='sigmoid'))
model.summary()

2、模型的行为和层类似？

向Sequential模型中添加一个模型（比如vgg16）：所以你可以向 Sequential 模型中添加一个模型（比如 conv_base），就像添加一个层一样。

3、在编译和训练模型之前，一定要“冻结”卷积基？

【冻结表示权重不变】：冻结（freeze）一个或多个层是指在训练过程中保持其权重不变。

【不冻结会破坏预训练的网络】：如果不这么做，那么卷积基之前学到的表示将会在训练过程中被修改。因为其上添加的 Dense 层是随机初始化的，所以非常大的权重更新将会在网络中传播，对之前学到的表示造成很大破坏。

4、在 Keras 中，如何冻结网络？

【将其trainable属性设为False】：在 Keras 中，冻结网络的方法是将其 trainable 属性设为 False。

conv_base.trainable = False

>>> print('This is the number of trainable weights '          
    'before freezing the conv base:', len(model.trainable_weights)) 
This is the number of trainable weights before freezing the conv base: 30 
>>> conv_base.trainable = False 
>>> print('This is the number of trainable weights '           
    'after freezing the conv base:', len(model.trainable_weights)) 
This is the number of trainable weights after freezing the conv base: 4

二、5.3-3、猫狗分类（使用预训练网络-数据增强的特征提取）

博客对应课程的视频位置：

import pandas as pd
import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt

In [2]:

from tensorflow.keras.applications import VGG16 

# 把vgg模型弄过来
conv_base = VGG16(weights='imagenet',    
                  # include_top=False表示不包含dense层
                  include_top=False,                   
                  input_shape=(150, 150, 3))
# C:\Users\Fan Renyi\.keras\models\vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5

扩展 conv_base 模型，然后在输入数据上端到端地运行模型。

模型的行为和层类似，所以你可以向 Sequential 模型中添加一个模型（比如 conv_base），就像添加一个层一样。

In [11]:

import os 
base_dir = 'E:\\78_recorded_lesson\\001_course_github\\AI_dataSet\\dogs-vs-cats\\cats_and_dogs_small'
train_dir = os.path.join(base_dir, 'train')  
validation_dir = os.path.join(base_dir, 'validation')  
test_dir = os.path.join(base_dir, 'test')

In [4]:

from tensorflow.keras import models 
from tensorflow.keras import layers 
 
model = models.Sequential() 
model.add(conv_base) 
model.add(layers.Flatten()) 
model.add(layers.Dense(256, activation='relu')) 
model.add(layers.Dense(1, activation='sigmoid'))
model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
vgg16 (Functional)           (None, 4, 4, 512)         14714688  
_________________________________________________________________
flatten (Flatten)            (None, 8192)              0         
_________________________________________________________________
dense (Dense)                (None, 256)               2097408   
_________________________________________________________________
dense_1 (Dense)              (None, 1)                 257       
=================================================================
Total params: 16,812,353
Trainable params: 16,812,353
Non-trainable params: 0
_________________________________________________________________

如你所见，VGG16 的卷积基有 14 714 688 个参数，非常多。在其上添加的分类器有 200 万个参数。

冻结卷积层

In [5]:

print('This is the number of trainable weights before freezing the conv base:', len(model.trainable_weights))

This is the number of trainable weights before freezing the conv base: 30

In [6]:

conv_base.trainable = False

In [7]:

print('This is the number of trainable weights after freezing the conv base:', len(model.trainable_weights))

This is the number of trainable weights after freezing the conv base: 4

如此设置之后，只有添加的两个 Dense 层的权重才会被训练。总共有4 个权重张量，每层 2 个（主权重矩阵和偏置向量）。注意，为了让这些修改生效，你必须先编译模型。如果在编译之后修改了权重的 trainable 属性，那么应该重新编译模型，否则这些修改将被忽略。

3、利用冻结的卷积基端到端地训练模型

In [14]:

from tensorflow.keras.preprocessing.image import ImageDataGenerator 
from tensorflow.keras import optimizers 

train_datagen = ImageDataGenerator(       
    rescale=1./255,       
    rotation_range=40,       
    width_shift_range=0.2,       
    height_shift_range=0.2,       
    shear_range=0.2,       
    zoom_range=0.2,       
    horizontal_flip=True,       
    fill_mode='nearest')

# 注意，不能增强验证数据
test_datagen = ImageDataGenerator(rescale=1./255) 

train_generator = train_datagen.flow_from_directory(         
    train_dir, # 目标目录
    target_size=(150, 150), # 将所有图像的大小调整为 150×150
    batch_size=20,         
    class_mode='binary') # 因为使用了binary_crossentropy 损失，所以需要用二进制标签

validation_generator = test_datagen.flow_from_directory(         
    validation_dir,         
    target_size=(150, 150),         
    batch_size=20,         
    class_mode='binary') 

model.compile(loss='binary_crossentropy',               
              optimizer=optimizers.RMSprop(lr=2e-5),               
              metrics=['acc'])

Found 2000 images belonging to 2 classes.
Found 1000 images belonging to 2 classes.

In [15]:

history = model.fit(       
    train_generator,       
    steps_per_epoch=100,       
    epochs=130,       
    validation_data=validation_generator,       
    validation_steps=50)

Epoch 1/130
100/100 [==============================] - 19s 192ms/step - loss: 0.2739 - acc: 0.8880 - val_loss: 0.2376 - val_acc: 0.9030
Epoch 2/130
100/100 [==============================] - 19s 191ms/step - loss: 0.2712 - acc: 0.8870 - val_loss: 0.2447 - val_acc: 0.8960
Epoch 3/130
100/100 [==============================] - 20s 201ms/step - loss: 0.2732 - acc: 0.8870 - val_loss: 0.2383 - val_acc: 0.8980
Epoch 4/130
100/100 [==============================] - 20s 201ms/step - loss: 0.2765 - acc: 0.8775 - val_loss: 0.2384 - val_acc: 0.9000
Epoch 5/130
100/100 [==============================] - 21s 206ms/step - loss: 0.2956 - acc: 0.8740 - val_loss: 0.2488 - val_acc: 0.8950
Epoch 6/130
100/100 [==============================] - 21s 213ms/step - loss: 0.2715 - acc: 0.8845 - val_loss: 0.2375 - val_acc: 0.9050
Epoch 7/130
100/100 [==============================] - 20s 201ms/step - loss: 0.2795 - acc: 0.8735 - val_loss: 0.2405 - val_acc: 0.9000
Epoch 8/130
100/100 [==============================] - 20s 204ms/step - loss: 0.2739 - acc: 0.8875 - val_loss: 0.2377 - val_acc: 0.9010
Epoch 9/130
100/100 [==============================] - 21s 211ms/step - loss: 0.2802 - acc: 0.8750 - val_loss: 0.2431 - val_acc: 0.8990
......
Epoch 114/130
100/100 [==============================] - 17s 174ms/step - loss: 0.2238 - acc: 0.9070 - val_loss: 0.2567 - val_acc: 0.8960
Epoch 115/130
100/100 [==============================] - 17s 173ms/step - loss: 0.2203 - acc: 0.9060 - val_loss: 0.2550 - val_acc: 0.9010
Epoch 116/130
100/100 [==============================] - 17s 174ms/step - loss: 0.2187 - acc: 0.9085 - val_loss: 0.2510 - val_acc: 0.9010
Epoch 117/130
100/100 [==============================] - 17s 174ms/step - loss: 0.2288 - acc: 0.9015 - val_loss: 0.2504 - val_acc: 0.9040
Epoch 118/130
100/100 [==============================] - 17s 173ms/step - loss: 0.2015 - acc: 0.9225 - val_loss: 0.2518 - val_acc: 0.9020
Epoch 119/130
100/100 [==============================] - 17s 174ms/step - loss: 0.2242 - acc: 0.9020 - val_loss: 0.2497 - val_acc: 0.9030
Epoch 120/130
100/100 [==============================] - 17s 174ms/step - loss: 0.2066 - acc: 0.9125 - val_loss: 0.2600 - val_acc: 0.8990
Epoch 121/130
100/100 [==============================] - 17s 173ms/step - loss: 0.2248 - acc: 0.9075 - val_loss: 0.2518 - val_acc: 0.9030
Epoch 122/130
100/100 [==============================] - 17s 174ms/step - loss: 0.2062 - acc: 0.9175 - val_loss: 0.2630 - val_acc: 0.9000
Epoch 123/130
100/100 [==============================] - 17s 174ms/step - loss: 0.2259 - acc: 0.9055 - val_loss: 0.2500 - val_acc: 0.9030
Epoch 124/130
100/100 [==============================] - 17s 173ms/step - loss: 0.2108 - acc: 0.9150 - val_loss: 0.2533 - val_acc: 0.8970
Epoch 125/130
100/100 [==============================] - 17s 173ms/step - loss: 0.2185 - acc: 0.9075 - val_loss: 0.2602 - val_acc: 0.8980
Epoch 126/130
100/100 [==============================] - 17s 173ms/step - loss: 0.2157 - acc: 0.9110 - val_loss: 0.2636 - val_acc: 0.8980
Epoch 127/130
100/100 [==============================] - 17s 174ms/step - loss: 0.2096 - acc: 0.9100 - val_loss: 0.2523 - val_acc: 0.9020
Epoch 128/130
100/100 [==============================] - 17s 174ms/step - loss: 0.2149 - acc: 0.9085 - val_loss: 0.2585 - val_acc: 0.9010
Epoch 129/130
100/100 [==============================] - 17s 174ms/step - loss: 0.2131 - acc: 0.9100 - val_loss: 0.2516 - val_acc: 0.9020
Epoch 130/130
100/100 [==============================] - 17s 173ms/step - loss: 0.2318 - acc: 0.9040 - val_loss: 0.2485 - val_acc: 0.8980

In [16]:

acc = history.history['acc'] 
val_acc = history.history['val_acc'] 
loss = history.history['loss'] 
val_loss = history.history['val_loss'] 

epochs = range(1, len(acc) + 1) 

plt.plot(epochs, acc, 'b--', label='Training acc') 
plt.plot(epochs, val_acc, 'r-', label='Validation acc') 
plt.title('Training and validation accuracy') 
plt.legend() 

plt.figure() 

plt.plot(epochs, loss, 'b--', label='Training loss') 
plt.plot(epochs, val_loss, 'r-', label='Validation loss') 
plt.title('Training and validation loss') 
plt.legend() 

plt.show()

《python深度学习》笔记---5.3-3、猫狗分类（使用预训练网络-数据增强的特征提取）

In [ ]:

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：《python深度学习》笔记—5.3-3、猫狗分类（使用预训练网络-数据增强的特征提取） - Python技术站

深度学习

0 0 打赏

微信扫一扫

支付宝扫一扫

《python深度学习》笔记—5.2-3、猫狗分类（基本模型）

上一篇 2023年4月13日

《深度学习》学习笔记（一）：稀疏自编码器（Sparse Autoencoder）

下一篇 2023年4月13日

分享：一天搞懂深度学习

一个台湾人写的PPT，很不错，通俗易懂，里面还有很多干货。 http://www.slideshare.net/tw_dsconf/ss-62245351?qid=108adce3-2c3d-4758-a830-95d0a57e46bc&v=&b=&from_search=3 推荐一篇非常不错的文章：《1天搞懂深度学习》，300多页的ppt，一个台湾…

深度学习 2023年4月16日
000
事实胜于雄辩,苹果MacOs能不能玩儿机器/深度(ml/dl)学习(Python3.10/Tensorflow2)

坊间有传MacOs系统不适合机器(ml)学习和深度(dl)学习，这是板上钉钉的刻板印象，就好像有人说女生不适合编程一样的离谱。现而今，无论是Pytorch框架的MPS模式，还是最新的Tensorflow2框架，都已经可以在M1/M2芯片的Mac系统中毫无桎梏地使用GPU显卡设备，本次我们来分享如何在苹果MacOS系统上安装和配置Tensorflow2框架（C…

深度学习 2023年4月13日
000
深度学习的“ 端到端模型“（end-to-end learning）

　　相对于深度学习，传统机器学习的流程往往由多个独立的模块组成，比如在一个典型的自然语言处理（Natural Language Processing）问题中，包括分词、词性标注、句法分析、语义分析等多个独立步骤，每个步骤是一个独立的任务，其结果的好坏会影响到下一步骤，从而影响整个训练的结果，这是非端到端的。　　而深度学习模型在训练过程中，从输入端（…

深度学习 2023年4月10日
000
深度学习

Deep Learning 1_深度学习UFLDL教程：Sparse Autoencoder练习（斯坦福大学深度学习教程）

本人写技术博客的目的，其实是感觉好多东西，很长一段时间不动就会忘记了，为了加深学习记忆以及方便以后可能忘记后能很快回忆起自己曾经学过的东西。首先，在网上找了一些资料，看见介绍说UFLDL很不错，很适合从基础开始学习，Adrew Ng大牛写得一点都不装B，感觉非常好，另外对我们英语不好的人来说非常感谢，此教程的那些翻译者们！如余凯等。因为…

2023年4月10日
000
深度学习中Embedding的理解

一、总结一句话总结： Embedding就是把高维的one-hot进行降维的过程。 1、Embedding的概念引入？ 1)、一维列表也不行，二维稀疏矩阵也不行，怎么办呢？这里就引入了Embedding的概念，由密集向量表示，实现降维！ 2)、“并不是每个单词都会被一个向量来代替，而是被替换为用于查找嵌入矩阵中向量的索引” 3)、同时训练神经网络时…

深度学习 2023年4月13日
000
深度学习笔记(二)：简单神经网络，后向传播算法及实现【转】

本文转载自：https://blog.csdn.net/u014595019/article/details/52557623 在之前的深度学习笔记(一):logistic分类中，已经描述了普通logistic回归以及如何将logistic回归用于多类分类。在这一节，我们再进一步，往其中加入隐藏层，构建出最简单的神经网络 2.1 大概描述和公式表达…

深度学习 2023年4月13日
000
一入侯门“深”似海，深度学习深几许（入门系列之一）

摘要：当你和女朋友在路边手拉手一起约会的时候，你可曾想，你们之间早已碰撞出了一种神秘的智慧–深度学习。恋爱容易，相处不易，不断磨合，打造你们的默契，最终才能决定你们是否在一起。深度学习也一样，输入各种不同的参数，进行训练拟合，最后输出拟合结果。恋爱又不易，且学且珍惜！【导言】目前人工智能非常火爆，而深度学习则是引领这一火爆现场的“火箭”。于是，有关“…

深度学习 2023年4月11日
000
深度学习读书笔记之RBM（限制波尔兹曼机）

声明： 1）看到其他博客如@zouxy09都有个声明，老衲也抄袭一下这个东西 2）该博文是整理自网上很大牛和机器学习专家所无私奉献的资料的。具体引用的资料请看参考文献。具体的版本声明也参考原文献。 3）本文仅供学术交流，非商用。所以每一部分具体的参考资料并没有详细对应，更有些部分本来就是直接从其他博客复制过来的。如果某部分不小心侵犯了大家的利益，还望海涵，并…

深度学习 2023年4月13日
000

《python深度学习》笔记—5.3-3、猫狗分类（使用预训练网络-数据增强的特征提取）

一、总结

一句话总结：

其实就是把vgg16对应的conv_base像层一样放到Sequential中，然后对图片进行数据增强即可

model.add(conv_base)

1、模型的行为和层类似？

向Sequential模型中添加一个模型（比如vgg16）：所以你可以向 Sequential 模型中添加一个模型（比如 conv_base）， 就像添加一个层一样。

2、模型的行为和层类似？

向Sequential模型中添加一个模型（比如vgg16）：所以你可以向 Sequential 模型中添加一个模型（比如 conv_base）， 就像添加一个层一样。

3、在编译和训练模型之前，一定要“冻结”卷积基？

【冻结表示权重不变】：冻结（freeze）一个或多个层是指在训练 过程中保持其权重不变。

【不冻结会破坏预训练的网络】：如果不这么做，那么卷积基之前学到的表示将会在训练过程中被修改。 因为其上添加的 Dense 层是随机初始化的，所以非常大的权重更新将会在网络中传播，对之前 学到的表示造成很大破坏。

4、在 Keras 中，如何冻结网络？

【将其trainable属性设为False】：在 Keras 中，冻结网络的方法是将其 trainable 属性设为 False。

conv_base.trainable = False

二、5.3-3、猫狗分类（使用预训练网络-数据增强的特征提取）

冻结卷积层

3、利用冻结的卷积基端到端地训练模型

相关文章

向Sequential模型中添加一个模型（比如vgg16）：所以你可以向 Sequential 模型中添加一个模型（比如 conv_base），就像添加一个层一样。

向Sequential模型中添加一个模型（比如vgg16）：所以你可以向 Sequential 模型中添加一个模型（比如 conv_base），就像添加一个层一样。

【冻结表示权重不变】：冻结（freeze）一个或多个层是指在训练过程中保持其权重不变。

【不冻结会破坏预训练的网络】：如果不这么做，那么卷积基之前学到的表示将会在训练过程中被修改。因为其上添加的 Dense 层是随机初始化的，所以非常大的权重更新将会在网络中传播，对之前学到的表示造成很大破坏。