数据增强（from keras.preprocessing.image import ImageDataGenerator）

2023年4月8日下午2:34 • Keras

from keras.preprocessing.image import ImageDataGenerator

keras.preprocessing.image.ImageDataGenerator(featurewise_center=False,
    samplewise_center=False,
    featurewise_std_normalization = False,
    samplewise_std_normalization = False,
    zca_whitening = False,
    rotation_range = 0.,
    width_shift_range = 0.,
    height_shift_range = 0.,
    shear_range = 0.,
    zoom_range = 0.,
    channel_shift_range = 0.,
    fill_mode = 'nearest',
    cval = 0.0,
    horizontal_flip = False,
    vertical_flip = False,
    rescale = None,
    preprocessing_function = None,
    data_format = K.image_data_format(),
)

参数的介绍：

1.featurewise_center：布尔值，使输入数据集去中心化（均值为0）, 按feature执行。

2.samplewise_center：布尔值，使输入数据的每个样本均值为0 。

3.featurewise_std_normalization：布尔值，将输入除以数据集的标准差以完成标准化, 按feature执行。

4.samplewise_std_normalization：布尔值，将输入的每个样本除以其自身的标准差。

5. zca_whitening：布尔值，对输入数据施加ZCA白化。

6. rotation_range：整数，数据提升时图片随机转动的角度。随机选择图片的角度，是一个0~180的度数，取值为0~180。 7.width_shift_range：浮点数，图片宽度的某个比例，数据提升时图片随机水平偏移的幅度。

8.height_shift_range：浮点数，图片高度的某个比例，数据提升时图片随机竖直偏移的幅度。 height_shift_range和width_shift_range是用来指定水平和竖直方向随机移动的程度，这是两个0~1之间的比例。

9: shear_range：浮点数，剪切强度（逆时针方向的剪切变换角度）。是用来进行剪切变换的程度。

10:zoom_range：浮点数或形如[lower,upper]的列表，随机缩放的幅度，若为浮点数，则相当于[lower,upper] = [1 - zoom_range, 1+zoom_range]。用来进行随机的放大。

11:channel_shift_range：浮点数，随机通道偏移的幅度。

12: fill_mode：‘constant’，‘nearest’，‘reflect’或‘wrap’之一，当进行变换时超出边界的点将根据本参数给定的方法进行处理 cval：浮点数或整数，当fill_mode=constant时，指定要向超出边界的点填充的值。

13:cval：浮点数或整数，当fill_mode=constant时，指定要向超出边界的点填充的值。

14:horizontal_flip：布尔值，进行随机水平翻转。随机的对图片进行水平翻转，这个参数适用于水平翻转不影响图片语义的时候。

15:vertical_flip：布尔值，进行随机竖直翻转。 rescale: 值将在执行其他处理前乘到整个图像上，我们的图像在RGB通道都是0~255的整数，这样的操作可能使图像的值过高或过低，所以我们将这个值定为0~1之间的数。

16:rescale: 值将在执行其他处理前乘到整个图像上，我们的图像在RGB通道都是0~255的整数，这样的操作可能使图像的值过高或过低，所以我们将这个值定为0~1之间的数

17:preprocessing_function: 将被应用于每个输入的函数。该函数将在任何其他修改之前运行。该函数接受一个参数，为一张图片（秩为3的numpy array），并且输出一个具有相同shape的numpy array

18:data_format：字符串，“channel_first”或“channel_last”之一，代表图像的通道维的位置。该参数是Keras 1.x中的image_dim_ordering，“channel_last”对应原本的“tf”，“channel_first”对应原本的“th”。以128x128的RGB图像为例，“channel_first”应将数据组织为（3,128,128），而“channel_last”应将数据组织为（128,128,3）。该参数的默认值是~/.keras/keras.json中设置的值，若从未设置过，则为“channel_last”

下面举一个例子：

我们先来一张图片：

数据增强（from keras.preprocessing.image import ImageDataGenerator）

一只看起来傻傻的猫，哈哈哈哈

下面给小猫找小伙伴

from keras.preprocessing.image import ImageDataGenerator, array_to_img, img_to_array, load_img

datagen = ImageDataGenerator(
    rotation_range=30,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest')


img = load_img('D:\\cat1.jpg')  # this is a PIL image
x = img_to_array(img)  # this is a Numpy array with shape (3, 150, 150)
x = x.reshape((1,) + x.shape)  # this is a Numpy array with shape (1, 3, 150, 150)
# the .flow() command below generates batches of randomly transformed images

i = 0
for batch in datagen.flow(x, batch_size=1,  # save_to_dir 要保存的文件夹   prefix图片名字   format图片的格式
                          save_to_dir='./Model', save_prefix='cat', save_format='jpeg'):
    i += 1
    if i >10: 
        break

根据我上面的参数的信息，可以很容易的解读这个代码。

datagen.flow参数代码有解释。

下面看看小猫的小伙伴吧：

数据增强（from keras.preprocessing.image import ImageDataGenerator）

哈哈哈，孪生兄弟。

好啦，下面给大家推荐一下大佬的博客，里面所有的参数都测试了，有效果图。

https://blog.csdn.net/jacke121/article/details/79245732

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：数据增强（from keras.preprocessing.image import ImageDataGenerator） - Python技术站

Keras 人工智能

0 0 打赏

微信扫一扫

支付宝扫一扫

使用Keras进行深度学习：（五）RNN和双向RNN讲解及实践

上一篇 2023年4月8日下午2:34

解决已安装python2.7 来安装python3.5的共存和安装问题及Anoconda安装及搭建：TensorFlow、Keras

下一篇 2023年4月8日下午2:35

卷积神经网络

卷积神经网络的复杂度分析

原文链接： https://zhuanlan.zhihu.com/p/31575074 在梳理CNN经典模型的过程中，我理解到其实经典模型演进中的很多创新点都与改善模型计算复杂度紧密相关，因此今天就让我们对卷积神经网络的复杂度分析简单总结一下下。本文主要关注的是针对模型本身的复杂度分析（其实并不是很复杂啦～）。如果想要进一步评估模型在计算平台上的理论计算性…

2023年4月8日
000
机器学习笔记：sklearn.model_selection.train_test_split切分训练、测试集

一、背景接上所叙，在对比训练集、验证集、测试集之后，实战中需要对数据进行划分。通常将原始数据按比例划分为：训练集、测试集。可以利用 sklearn.model_selection.train_test_split 方法实现。二、介绍使用语法为： x_train, x_test, y_train, y_test = sklearn.model_sel…

机器学习 2023年4月12日
000
目标检测

对话CVPR2016：目标检测新进展

今天我与大家分享的是CVPR2016年会议中关于目标检测的部分相关工作，这一篇文章首先在深度学习大讲堂发出，这里算是转载吧，在此也给深度学习大讲堂做个广告。文章所提到的内容不涉及具体的实现细节，更多是从整个工作的出发点和解决问题的思路出发进行讨论，下边是具体的内容。 2016年的CVPR会议目标检测（在这里讨论的是2D的目标检测，如图1所示）的方法主要是…

2023年4月8日
000
卷积神经网络

吴恩达深度学习 course4 卷积神经网络

1.computer vision cv是深度学习的一个重要方向,cv一般而言包括:图像识别,目标检测,神经风格转换传统的神经网络所存在的问题:图片的输入维度比较大,具体如下图所示,这就造成了权重w的维度比较大,那么他所占用的内存也会比较大,计算w的计算量也会很大所以我们会引入卷积神经网络 2.Edge detection example 神经网络由浅层…

2023年4月8日
000
Keras

Keras如何构造简单的CNN网络

1. 导入各种模块基本形式为： import 模块名 from 某个文件 import 某个模块 2. 导入数据（以两类分类问题为例，即numClass = 2）训练集数据data 可以看到，data是一个四维的ndarray 训练集的标签 3. 将导入的数据转化我keras可以接受的数据格式 keras要求的label格式应该为binar…

2023年4月7日
000
GAN生成对抗网络

简单理解与实验生成对抗网络GAN（2）

引入 Discriminative Model的繁荣发展最近，深度学习在很多领域的突破性进展想必不用我多说了。但大家似乎发现了这样的一个现实，即深度学习取得突破性进展的地方貌似都是discriminative的模型。所谓的discriminative可以简单的认为是分类问题，比如给一张图片，判断这张图片上有什么动物；再比如给定一段语音，判断这段语音所对应…

2023年4月6日
000
【机器学习】Cross-Validation（交叉验证）详解

本文章部分内容基于之前的一篇专栏文章：统计学习引论在机器学习里，通常来说我们不能将全部用于数据训练模型，否则我们将没有数据集对该模型进行验证，从而评估我们的模型的预测效果。为了解决这一问题，有如下常用的方法： 1.The Validation Set Approach 第一种是最简单的，也是很容易就想到的。我们可以把整个数据集分成两部分，一部分用于训练，一…

机器学习 2023年4月10日
000
GAN生成对抗网络

常见的五种神经网络(5)-生成对抗网络（上）之GAN、DCGAN、W-GAN

在上一篇文章中介绍了生成模型的基本结构、功能和变分自动编码器，在本篇文章中主要介绍一下生成对抗网络（Generative Adversaarial Networks，GAN） KL散度、JS散度、Wassertein距离 KL散度 KL散度又称相对熵，信息散度，信息增益。KL散度是两个概率分布P和Q差别的非对称性的度量。在经典境况下，P表示数据的真实分布，Q…

2023年4月6日
000

数据增强（from keras.preprocessing.image import ImageDataGenerator）

相关文章