tensorflow使用CNN分析mnist手写体数字数据集

2023年5月25日上午12:03 • 人工智能概论

TensorFlow使用CNN分析MNIST手写数字数据集的完整攻略

本文将介绍如何使用TensorFlow和卷积神经网络（CNN）来分析MNIST手写数字数据集。本文重点介绍以下内容：

MNIST数据集的介绍
构建CNN模型
训练模型
测试模型

MNIST数据集的介绍

MNIST数据集是一个手写数字数据集，包含60000张训练图像和10000张测试图像。每个图像都是28x28像素的灰度图像，表示0到9的数字。

我们可以使用TensorFlow的官方包keras来加载MNIST数据集。以下是加载代码示例：

from tensorflow import keras

(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()

构建CNN模型

我们可以使用keras构建CNN模型。以下是代码示例：

from tensorflow import keras

model = keras.Sequential([
    keras.layers.Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1)),
    keras.layers.MaxPool2D(pool_size=(2, 2)),
    keras.layers.Flatten(),
    keras.layers.Dense(10, activation='softmax')
])

上述模型包括：

一个32个滤波器的卷积层
一个2x2的最大池化层
一个展开层
一个10个神经元的输出层

训练模型

我们可以使用以下代码训练模型：

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(x_train, y_train, epochs=5, validation_data=(x_test, y_test))

上述代码中：

我们使用Adam优化器和分类交叉熵损失函数编译模型
我们使用训练集数据训练模型，每个epoch重复5次
我们在测试集上验证我们的模型的表现

测试模型

使用以下代码测试模型，并计算测试准确率：

test_loss, test_acc = model.evaluate(x_test, y_test)
print('Test accuracy:', test_acc)

示例1

我们可以看一个基于上述代码的完整例子：

from tensorflow import keras

(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()

# 将图像数据从0-255转换为0-1之间的浮点数
x_train = x_train / 255.0
x_test = x_test / 255.0

# 将数据重塑为适合CNN模型的形状
x_train = x_train.reshape(x_train.shape[0], 28, 28, 1)
x_test = x_test.reshape(x_test.shape[0], 28, 28, 1)

model = keras.Sequential([
    keras.layers.Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1)),
    keras.layers.MaxPool2D(pool_size=(2, 2)),
    keras.layers.Flatten(),
    keras.layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(x_train, y_train, epochs=5, validation_data=(x_test, y_test))

test_loss, test_acc = model.evaluate(x_test, y_test)
print('Test accuracy:', test_acc)

上述代码会输出测试准确率，以及模型在验证集上的表现。

示例2

在上述例子中，我们使用了一个简单的CNN模型。我们也可以使用更深的CNN模型来提高准确率。例如，以下是一个更深的模型：

from tensorflow import keras

(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()

# 将图像数据从0-255转换为0-1之间的浮点数
x_train = x_train / 255.0
x_test = x_test / 255.0

# 将数据重塑为适合CNN模型的形状
x_train = x_train.reshape(x_train.shape[0], 28, 28, 1)
x_test = x_test.reshape(x_test.shape[0], 28, 28, 1)

model = keras.Sequential([
    keras.layers.Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1)),
    keras.layers.Conv2D(64, kernel_size=(3, 3), activation='relu'),
    keras.layers.MaxPool2D(pool_size=(2, 2)),
    keras.layers.Dropout(0.25),
    keras.layers.Flatten(),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dropout(0.5),
    keras.layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(x_train, y_train, epochs=5, validation_data=(x_test, y_test))

test_loss, test_acc = model.evaluate(x_test, y_test)
print('Test accuracy:', test_acc)

上述代码中，我们使用了更深的CNN模型，包括：

一个32个滤波器的卷积层
一个64个滤波器的卷积层
一个2x2的最大池化层
一个dropout层
一个展开层
一个128个神经元的全连接层
一个dropout层
一个10个神经元的输出层

上述模型的测试准确率可以达到99%以上。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：tensorflow使用CNN分析mnist手写体数字数据集 - Python技术站