PyTorch——(7) MNIST手写数字识别实例

2023年4月8日上午11:49 • PyTorch

PyTorch——(7) MNIST手写数字识别实例

代码

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torchvision import datasets, transforms


batch_size=200
learning_rate=0.01
epochs=10

# 下载数据
train_loader = torch.utils.data.DataLoader(
    datasets.MNIST('../data', train=True, download=True,
                   transform=transforms.Compose([
                       transforms.ToTensor(),
                       transforms.Normalize((0.1307,), (0.3081,))
                   ])),
    batch_size=batch_size, shuffle=True)
test_loader = torch.utils.data.DataLoader(
    datasets.MNIST('../data', train=False, transform=transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize((0.1307,), (0.3081,))
    ])),
    batch_size=batch_size, shuffle=True)



w1, b1 = torch.randn(200, 784, requires_grad=True),\
         torch.zeros(200, requires_grad=True)
w2, b2 = torch.randn(200, 200, requires_grad=True),\
         torch.zeros(200, requires_grad=True)
w3, b3 = torch.randn(10, 200, requires_grad=True),\
         torch.zeros(10, requires_grad=True)

torch.nn.init.kaiming_normal_(w1)
torch.nn.init.kaiming_normal_(w2)
torch.nn.init.kaiming_normal_(w3)

#自己定义结构实现
def forward(x):
    x = x@w1.t() + b1
    x = F.relu(x)
    x = x@w2.t() + b2
    x = F.relu(x)
    x = x@w3.t() + b3
    x = F.relu(x)
    return x

# 使用Pytorch的API实现
class MLP(nn.Module):

    def __init__(self):
        super(MLP, self).__init__()

        self.model = nn.Sequential(
            nn.Linear(784, 200),
            nn.ReLU(inplace=True),
            nn.Linear(200, 200),
            nn.ReLU(inplace=True),
            nn.Linear(200, 10),
            nn.ReLU(inplace=True),
        )

    def forward(self, x):
        x = self.model(x)

        return x

# GPU加速
device = torch.device('cuda:0')
net = MLP().to(device)
# 优化方法SGD 待优化变量 [w1, b1, w2, b2, w3, b3]
# optimizer = optim.SGD([w1, b1, w2, b2, w3, b3], lr=learning_rate)#自己定义结构实现
optimizer = optim.SGD(net.parameters(), lr=learning_rate)# 使用Pytorch的API实现
# loss_function 交叉熵
criteon = nn.CrossEntropyLoss().to(device)

for epoch in range(epochs):

    for batch_idx, (data, target) in enumerate(train_loader):
        # 重构为x*28*28的尺寸  28*28=784
        data = data.view(-1, 28*28)
        # GPU加速
        data, target = data.to(device), target.cuda()
        # 网络结构
        # logits = forward(data)#自己定义结构实现
        logits = net(data)# 使用Pytorch的API实现
        # 计算损失函数
        loss = criteon(logits, target)
        # 初始化梯度为0
        optimizer.zero_grad()
        # 计算反向传播梯度
        loss.backward()
        # print(w1.grad.norm(), w2.grad.norm())
        # 进行一次优化更新
        optimizer.step()

        if batch_idx % 100 == 0:
            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
                epoch, batch_idx * len(data), len(train_loader.dataset),
                       100. * batch_idx / len(train_loader), loss.item()))


    test_loss = 0
    correct = 0
    for data, target in test_loader:
        data = data.view(-1, 28 * 28)
        data, target = data.to(device), target.cuda()
        # logits = forward(data)
        logits = net(data)
        test_loss += criteon(logits, target).item()

        pred = logits.data.max(1)[1]
        correct += pred.eq(target.data).sum()

    test_loss /= len(test_loader.dataset)
    print('\nTest set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(
        test_loss, correct, len(test_loader.dataset),
        100. * correct / len(test_loader.dataset)))

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：PyTorch——(7) MNIST手写数字识别实例 - Python技术站

pytorch 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

Pytorch自动求解梯度

上一篇 2023年4月8日

PyTorch——(3) tensor基本运算

下一篇 2023年4月8日

对抗样本(论文解读五):Perceptual-Sensitive GAN for Generating Adversarial Patches

准备写一个论文学习专栏，先以对抗样本相关为主，后期可能会涉及到目标检测相关领域。内容不是纯翻译，包括自己的一些注解和总结，论文的结构、组织及相关描述，以及一些英语句子和相关工作的摘抄(可以用于相关领域论文的写作及扩展)。平时只是阅读论文，有很多知识意识不到，当你真正去着手写的时候，发现写完之后可能只有自己明白做了个啥。包括从组织、结构、描述上等等很多方面…

GAN生成对抗网络 2023年4月7日
000
tf.keras 模型多个输入 tf.data.Dataset

import tensorflow as tf a = tf.keras.layers.Input(batch_shape=(None,10, 1)) b = tf.keras.layers.Input(batch_shape=(None,1)) fc1 = tf.keras.layers.Dense(16,’relu’)(a) fc2 = tf.keras…

Keras 2023年4月8日
000
目标检测

FPGA实现移动目标检测

　　上一篇整理了人脸检测，这篇讲一下移动目标检测。　　目前逐渐形成三种运动目标的检测算法：　　 1）帧间差分法是采用视频序列中的相邻两帧图像做差的方法，来检测视频序列中的移动目标。但是受运动目标和背景变化的影响，检测过程中有可能出现伪目标或者目标中出现“空洞”，在目标运动不是太快时可以有效的检测到目标。　　 2）背景减除法首先在没有目标的场景中获取…

2023年4月6日
000
keras 入门整理如何shuffle，如何使用fit_generator 整理合集基于sklearn和keras的数据切分与交叉验证

keras入门参考网址：中文文档教你快速建立model keras不同的模块-基本结构的简介-类似xmind整理 Keras的基本使用(1)–创建，编译，训练模型 Keras学习笔记(完结) keras分类应用里的人脸预测kaggle：根据人脸预测年龄性别和情绪人脸表情分类与识别：opencv人脸检测+Keras情绪分类（四）数据量大无法载入时，节…

Keras 2023年4月8日
000
CANN开发实践：4个DVPP内存问题的典型案例解读

摘要：由于DVPP媒体数据处理功能对存放输入、输出数据的内存有更高的要求（例如，内存首地址128字节对齐），因此需调用专用的内存申请接口，那么本期就分享几个关于DVPP内存问题的典型案例，并给出原因分析及解决方法。本文分享自华为云社区《FAQ_DVPP内存问题案例》，作者：昇腾CANN。 DVPP是昇腾AI处理器内置的图像处理单元，通过AscendCL媒体…

人工智能概论 2023年4月19日
000
caffe之(四)全连接层

在caffe中，网络的结构由prototxt文件中给出，由一些列的Layer（层）组成，常用的层如：数据加载层、卷积操作层、pooling层、非线性变换层、内积运算层、归一化层、损失计算层等；本篇主要介绍全连接层该层是对元素进行wise to wise的运算 1. 全连接层总述下面首先给出全连接层的结构设置的一个小例子（定义在.prototxt文件中） …

Caffe 2023年4月8日
000
100天搞定机器学习|Day55 最大熵模型

1、熵的定义熵最早是一个物理学概念，由克劳修斯于1854年提出，它是描述事物无序性的参数，跟热力学第二定律的宏观方向性有关：在不加外力的情况下，总是往混乱状态改变。熵增是宇宙的基本定律，自然的有序状态会自发的逐步变为混沌状态。1948年，香农将熵的概念引申到信道通信的过程中，从而开创了”信息论“这门学科。香农用“信息熵”来描述随机变量的不确定程度，也即信息…

机器学习 2023年4月13日
000
GAN生成对抗网络

【转】RL-GAN For NLP: 强化学习在生成对抗网络文本生成中扮演的角色

本文转载自： https://zhuanlan.zhihu.com/p/29168803 目录【导读】本文全面系统性梳理介绍了强化学习用于发掘GAN在NLP领域的潜力，请大家阅读。 1. 基础：文本生成模型的标准框架 2. 问题：GAN为何不能直接用于文本生成 2.1. GAN基础知识 2.2. GAN面对离散型数据时的困境（啥是离散型数据？） 3. 过渡…

2023年4月6日
000

合作推广

合作推广

返回顶部