利用卷积神经网络实现MNIST手写数据识别

2023年4月6日上午12:19 • 卷积神经网络

代码：

import torch
import torch.nn as nn
import torch.utils.data as Data
import torchvision      # 数据库模块
import matplotlib.pyplot as plt

torch.manual_seed(1)    # reproducible
# Hyper Parameters
EPOCH = 1           # 训练整批数据多少次, 为了节约时间, 我们只训练一次
BATCH_SIZE = 50
LR = 0.001          # 学习率
DOWNLOAD_MNIST = False  # 如果你已经下载好了mnist数据就写上 False
# Mnist 手写数字
train_data = torchvision.datasets.MNIST(
    root='./mnist/',    # 保存或者提取位置
    train=True,  # this is training data
    transform=torchvision.transforms.ToTensor(),    # 转换 PIL.Image or numpy.ndarray 成
                                                    # torch.FloatTensor (C x H x W), 训练的时候 normalize 成 [0.0, 1.0] 区间
    download=DOWNLOAD_MNIST,          # 没下载就下载, 下载了就不用再下了
)
#plot one example
# print(train_data.test_data.shape)#torch.Size([60000, 28, 28])
# print(train_data.train_labels.shape)#torch.Size([60000])
# print(train_data.train_data[0].shape)#torch.Size([28, 28])
#
# plt.imshow(train_data.train_data[1],cmap='gray')
# plt.title('%d'%train_data.train_labels[1])
# plt.show()

#测试数据
test_data = torchvision.datasets.MNIST(root='./mnist/', train=False)

# print(test_data.test_data.shape)#torch.Size([10000, 28, 28])
# 为了节约时间, 我们测试时只测试前2000个
test_x = torch.unsqueeze(test_data.test_data, dim=1).type(torch.FloatTensor)[:2000]   # /255.shape from (2000, 28, 28) to (2000, 1, 28, 28), value in range(0,1)
test_y = test_data.test_labels[:2000]

# 批训练 50samples, 1 channel, 28x28 (50, 1, 28, 28)
train_loader = Data.DataLoader(dataset=train_data, batch_size=BATCH_SIZE, shuffle=True)

class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()
        self.conv1=nn.Sequential(
            nn.Conv2d(
                in_channels=1,
                out_channels=16,#n_filters
                kernel_size=5,  # filter size
                stride=1,  # filter movement/step
                padding=2,  # 如果想要 con2d 出来的图片长宽没有变化, padding=(kernel_size-1)/2 当 stride=1
            ),# output shape (16, 28, 28)
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2)# output shape (16, 14, 14)
        )
        self.conv2=nn.Sequential(
            nn.Conv2d(16,32,5,1,2),# output shape (32, 14, 14)
            nn.ReLU(),
            nn.MaxPool2d(2)# output shape (32, 7, 7)
        )
        self.out=nn.Linear(32*7*7,10)# fully connected layer, output 10 classes
    def forward(self, x):
        x=self.conv1(x)
        x=self.conv2(x)
        #print(x.shape)#output:torch.Size([50, 32, 7, 7])
        x = x.view(x.size(0), -1) # 展平多维的卷积图成 (batch_size, 32 * 7 * 7)
        # print(x.shape)#output:torch.Size([50, 1568])
        output = self.out(x)
        return output
cnn=CNN()
optimizer = torch.optim.Adam(cnn.parameters(), lr=LR)   # optimize all cnn parameters
loss_func = nn.CrossEntropyLoss()   # the target label is not one-hotted
# training and testing
for epoch in range(EPOCH):
    for step, (b_x, b_y) in enumerate(train_loader):   # 分配 batch data, normalize x when iterate train_loader
        print('step:',step)
        output = cnn(b_x)               # cnn output
        loss = loss_func(output, b_y)   # cross entropy loss
        optimizer.zero_grad()           # clear gradients for this training step
        loss.backward()                 # backpropagation, compute gradients
        optimizer.step()                # apply gradients
test_output = cnn(test_x[:10])
#test_x[:10].shape=torch.Size([10, 1, 28, 28])
#test_output.shape=torch.Size([10, 10])
print('test_output：',test_output)
# test_output： tensor([[-1383.2828, -1148.1272,   311.1780,   153.0877, -3062.3340,  -886.6730,
#          -5819.7256,  3619.9558, -1544.4225,   193.6745],
#         [  282.6339,   647.2642,  3027.1570,  -379.0817, -3403.5310, -2406.4951,
#          -1117.4684, -4085.4429,  -306.6578, -3844.1602],
#         [-1329.7642,  1895.3890,  -755.7719, -1378.9316,  -314.2351, -1607.4249,
#          -1026.8795,  -428.1658,  -385.1328, -1404.5205],
#         [ 2991.5627, -3583.5374,  -554.1349, -2472.6204, -1712.7700, -1092.7367,
#            148.9156, -1580.6696, -1126.8331,  -477.7481],
#         [-1818.9655, -1502.3574, -1620.6603, -2142.3472,  2529.0496, -2008.2731,
#          -1585.5699,  -786.7817, -1372.2627,   848.0875],
#         [-1415.7609,  2248.9607,  -909.5534, -1656.6108,  -311.2874, -2255.2163,
#          -1643.2495,  -149.4040,  -342.9626, -1372.8961],
#         [-3766.0422,  -484.8116, -1971.9016, -2483.8538,  1448.3118, -1048.7388,
#          -2411.9790, -1089.5471,   422.1722,   249.8736],
#         [-2933.3752,  -877.4833,  -671.7119,  -573.4670,    63.9295,  -497.9561,
#          -2236.4597, -1218.2463,  -296.5850,  1256.0739],
#         [-2187.7292, -4899.0063, -2404.6597, -2595.0764, -2987.9624,  2052.1494,
#            335.9461, -2942.6995,   275.7964,  -551.2797],
#         [-1903.9233, -3449.5530, -1652.7020, -1087.9016,  -515.1445, -1170.5551,
#          -3734.2666,   628.9314,    69.0235,  2096.6257]],
#        grad_fn=<AddmmBackward>)
print('test_output.shape：',test_output.shape)
# test_output.shape： torch.Size([10, 10])

pred_y = torch.max(test_output, 1)[1].data.numpy().squeeze()
print(pred_y, 'prediction number')
print(test_y[:10].numpy(), 'real number')

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：利用卷积神经网络实现MNIST手写数据识别 - Python技术站

人工智能卷积神经网络

0 0 打赏

微信扫一扫

支付宝扫一扫

卷积网络输出尺寸计算及卷积核相关

上一篇 2023年4月5日

TensorFlow——CNN卷积神经网络处理Mnist数据集

下一篇 2023年4月6日

目标检测

社区分享 | TensorFlow 2 实战之从零开始构建 YOLOv3 目标检测网络

引言今天为大家带来社区作者的精选推荐《Tensorfow 2 实战之从零开始构建 YOLOv3 目标检测网络》。想知道如何正确使用 Tensorflow 2 实现 YOLOv3 算法？CSDN 认证博客专家 @ZONG_XP 为你带来专业讲解，手把手教你搭建目标检测网络！网上虽然有很多利用 TensorFlow 实现 YOLOv3 的代码和文章，但感觉讲…

2023年4月6日
000
循环神经网络

动手学深度学习 | 双向循环神经网络 | 59

目录双向循环神经网络代码 QA 双向循环神经网络双向LSTM非常不适合做推理，基础是不能用在预测下一个词。 Bi-RNN的作用主要是对一个句子做特征提取，比如做翻译，给句子A翻译句子B，那么可以对句子A使用Bi-RNN去双向的看它。代码这里代码不会讲具体实现，但是其实很简单，前向的隐藏层就正常进行运算。反向的怎么实现呢？首先把reverse(in…

2023年4月6日
000
机器学习（二）回归

这一讲开始，每一讲都是一个重要的模型。由于我也是初学者，更新可能会慢了。现在的比较比较凌乱，等这些课程全部学完之后，会统一再整理一下。主要内容：线性回归——高斯分布、极大似然估计MLE、最小二乘法的本质 Logistic回归——分类问题的首选算法（简单）工具：梯度下降算法、极大似然估计回归与分类的简单区别：y连续变化的话就是回归问题，y是离散的，就是…

机器学习 2023年4月13日
000
目标检测

利用python爬取特定类别图片—labelimg制作自己的目标检测数据集

最近一直在学习神经网络，一方面是课题需要，另一方面是因为机器学习已经逐渐成为社会的潮流，各行各业都可以见到神经网络的应用，不学习一下都觉得自己落伍了。趁着这段时间没办法开学，好好学习了一些神经网络的基础内容，也试着把神经网络运用到自己的课题中来，今天在试验SSD目标检测网络的时候，发现要制作自己的训练集首先需要有训练的图片，可是一张一张找实在麻烦，找到了，逐…

2023年4月7日
000
GAN 生成对抗网络（一）

接下来将会有系列博客介绍GAN网络。生成模型与判别模型首先，需要搞清楚什么是生成模型，什么是判别模型。生成模型是指模型学习得到给定数据集上的一个联合分布。这里的随机变量是模型中所有可能的随机变量。举个例子来说，对于28×28的图片来说，生成模型会学习到28×28个像素组成的随机变量的联合分布。对于带标签的28×28的图片来说，生成模型会学习到28x…

GAN生成对抗网络 2023年4月7日
000
每天进步一点点——Sobel算子（3）基于彩色图像边缘差分的运动目标检测算法

摘要：针对目前常用的运动目标提取易受到噪声影响、易出现阴影和误检漏检等情况，提出了一种基于Sobel算子的彩色边缘图像检测和帧差分相结合的检测方法。首先用Sobel算子提取视频流中连续4帧图像的彩色边缘图像，然后将边缘图像进行隔帧差分相与，提取出较精确的运动目标边缘轮廓。提取的轮廓经过一系列的形态学操作填充，可得到完整的运动目标。实验结果表明,该方法…

目标检测 2023年4月7日
000
目标检测

anchor free的目标检测方法–CornerNet

作者：晟沚前言目前目标检测方法中深度方法主要分为one-stage(e.g. SSD, YOLO)和two-stage(e.g. RCNN系列)两种。one-stage直接在图片上经过计算生成detections。two-stage先提取proposal, 再基于proposal做二次修正。相对来说one-st…

2023年4月8日
000
目标检测：介绍及传统方法

计算机视觉中关于图像识别有四大类任务：分类-Classification：解决”是什么？”的问题，即给定一张图片或一段视频判断里面包含什么类别的目标。定位-Location：解决”在哪里？”的问题，即定位出这个目标的的位置。检测-Detection：解决”是什么？在哪里？”的问题，即定位出这个目标的的位置并且知道目标物是什么。分割-Segmentat…

目标检测 2023年4月7日
000

利用卷积神经网络实现MNIST手写数据识别

相关文章