人工智能学习PyTorch教程之层和块

2023年5月15日下午10:37 • 卷积神经网络

我会详细讲解“人工智能学习PyTorch教程之层和块”的完整攻略。本文将包含以下内容：

PyTorch中的层和块
利用层和块实现一个简单的神经网络分类器
利用层和块实现一个深度神经网络分类器

1. PyTorch中的层和块

在PyTorch中，层和块是用来构建神经网络的基本组成单元。层是指网络中相对比较简单的计算模块，如全连接层、卷积层、池化层、激活函数等；而块则是指由多个层组成的较复杂的计算模块，如ResNet中的基本块。

PyTorch中内置了许多常用的层和块，比如nn.Linear、nn.Conv2d、nn.BatchNorm2d等，我们可以通过继承nn.Module来自定义自己的层和块。

2. 利用层和块实现一个简单的神经网络分类器

接下来，我们将通过一个简单的例子来演示如何使用PyTorch中的层和块来实现一个简单的神经网络分类器。该分类器由三个全连接层组成，输入的特征向量为784维，输出为10个类别。

首先，我们需要定义一个继承于nn.Module的类，来实现自己的神经网络模型。代码如下：

import torch.nn as nn

class Classifier(nn.Module):
    def __init__(self):
        super(Classifier, self).__init__()
        self.fc1 = nn.Linear(784, 256)
        self.fc2 = nn.Linear(256, 128)
        self.fc3 = nn.Linear(128, 10)

    def forward(self, x):
        x = x.view(-1, 784)
        x = nn.functional.relu(self.fc1(x))
        x = nn.functional.relu(self.fc2(x))
        x = self.fc3(x)
        return x

上述代码中，我们定义了一个名为Classifier的类，继承于nn.Module。在构造函数中，我们定义了三个全连接层（fc1、fc2、fc3），分别将输入的784维特征映射到256、128、10维的输出。在forward函数中，我们将输入的形状转换为(batch_size, 784)，并通过relu激活函数进行非线性变换。最后一层不需要激活函数。

接下来，我们需要准备数据集，并进行模型训练。这里我们将使用MNIST手写数字数据集，代码如下：

import torch
import torchvision.datasets as dsets
import torchvision.transforms as transforms

train_dataset = dsets.MNIST(root='./data/',
                            train=True, 
                            transform=transforms.ToTensor(),
                            download=True)

test_dataset = dsets.MNIST(root='./data/',
                           train=False, 
                           transform=transforms.ToTensor())

train_loader = torch.utils.data.DataLoader(dataset=train_dataset,
                                           batch_size=100, 
                                           shuffle=True)

test_loader = torch.utils.data.DataLoader(dataset=test_dataset,
                                          batch_size=100, 
                                          shuffle=False)

classifier = Classifier()
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(classifier.parameters(), lr=0.1)

num_epochs = 10
total_step = len(train_loader)

for epoch in range(num_epochs):
    for i, (images, labels) in enumerate(train_loader):
        outputs = classifier(images)
        loss = criterion(outputs, labels)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if (i+1) % 100 == 0:
            print ('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}' 
                   .format(epoch+1, num_epochs, i+1, total_step, loss.item()))

with torch.no_grad():
    correct = 0
    total = 0
    for images, labels in test_loader:
        outputs = classifier(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

    print('Test Accuracy of the model on the 10000 test images: {} %'.format(100 * correct / total))

上述代码中，我们首先定义了训练和测试数据集，并通过DataLoader进行数据读取和批次处理。接着，我们定义了分类器、损失函数和优化器。在每个epoch中，我们将训练集的每个batch都带入模型进行训练，并在训练过程中输出损失值。最终，我们将测试集输入模型，计算分类准确率。

3. 利用层和块实现一个深度神经网络分类器

现在，我们来尝试使用PyTorch的块来实现一个更深的神经网络分类器。我们将使用全连接层和BatchNorm层构建一个四层的神经网络，并使用ResNet的基本块来构建一个八层的神经网络。

首先，我们来看一下四层神经网络的代码：

class DeepClassifier(nn.Module):
    def __init__(self):
        super(DeepClassifier, self).__init__()
        self.fc1 = nn.Linear(784, 256)
        self.bn1 = nn.BatchNorm1d(256)
        self.fc2 = nn.Linear(256, 128)
        self.bn2 = nn.BatchNorm1d(128)
        self.fc3 = nn.Linear(128, 64)
        self.bn3 = nn.BatchNorm1d(64)
        self.fc4 = nn.Linear(64, 10)

    def forward(self, x):
        x = x.view(-1, 784)
        x = nn.functional.relu(self.bn1(self.fc1(x)))
        x = nn.functional.relu(self.bn2(self.fc2(x)))
        x = nn.functional.relu(self.bn3(self.fc3(x)))
        x = self.fc4(x)
        return x

上述代码中，我们依然定义了四个全连接层，但是在每个全连接层后面都添加了BatchNorm层。在forward函数中，我们先进行形状转换，然后依次带入四个全连接层和BatchNorm层中。最后一层不需要BatchNorm。

接着，我们来看一下八层神经网络的代码：

class ResBlock(nn.Module):
    def __init__(self, in_channels, out_channels, stride=1):
        super(ResBlock, self).__init__()
        self.conv1 = nn.Conv2d(in_channels, out_channels, kernel_size=3, stride=stride, padding=1, bias=False)
        self.bn1 = nn.BatchNorm2d(out_channels)
        self.conv2 = nn.Conv2d(out_channels, out_channels, kernel_size=3, stride=1, padding=1, bias=False)
        self.bn2 = nn.BatchNorm2d(out_channels)

        self.shortcut = nn.Sequential()
        if stride != 1 or in_channels != out_channels:
            self.shortcut = nn.Sequential(
                nn.Conv2d(in_channels, out_channels, kernel_size=1, stride=stride, bias=False),
                nn.BatchNorm2d(out_channels)
            )

    def forward(self, x):
        out = nn.functional.relu(self.bn1(self.conv1(x)))
        out = self.bn2(self.conv2(out))
        out += self.shortcut(x)
        out = nn.functional.relu(out)
        return out

class DeepResClassifier(nn.Module):
    def __init__(self):
        super(DeepResClassifier, self).__init__()
        self.conv1 = nn.Conv2d(1, 16, kernel_size=3, stride=1, padding=1, bias=False)
        self.bn1 = nn.BatchNorm2d(16)
        self.layer1 = self._make_layer(16, 32, 2)
        self.layer2 = self._make_layer(32, 64, 2)
        self.avgpool = nn.AdaptiveAvgPool2d((1, 1))
        self.fc = nn.Linear(64, 10)

    def _make_layer(self, in_channels, out_channels, stride):
        layers = []
        layers.append(ResBlock(in_channels, out_channels, stride))
        for i in range(1, 2):
            layers.append(ResBlock(out_channels, out_channels))
        return nn.Sequential(*layers)

    def forward(self, x):
        x = self.bn1(self.conv1(x))
        x = nn.functional.relu(x)
        x = self.layer1(x)
        x = self.layer2(x)
        x = self.avgpool(x)
        x = x.view(x.size(0), -1)
        x = self.fc(x)
        return x

上述代码中，我们定义了一个名为ResBlock的类，用来实现ResNet的基本块。在构造函数中，我们定义了两个卷积层和BatchNorm层，并使用shortcut连接实现跨层连接。在forward函数中，我们首先进行卷积层和BatchNorm层的计算，然后分别对输出和shortcut进行相加和非线性变换操作。

然后，我们定义了一个名为DeepResClassifier的类，用来构建一个八层的神经网络。在构造函数中，我们定义了首层的卷积层和BatchNorm层，中间两层使用ResBlock实现跨层连接，最后一层使用全局平均池化和全连接层实现分类任务。

最后，我们参照前例利用数据集和优化器，带入模型进行训练即可。

至此，我们讲解完了“人工智能学习PyTorch教程之层和块”的完整攻略，其中包括了两个基本示例和代码实现。希望能对你的学习有所帮助！

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：人工智能学习PyTorch教程之层和块 - Python技术站

卷积神经网络

0 0 打赏

微信扫一扫

支付宝扫一扫

python人工智能使用RepVgg实现图像分类示例详解

上一篇 2023年5月15日

PyTorch中的参数类torch.nn.Parameter()详解

下一篇 2023年5月15日

卷积神经网络

CNN中卷积的意义

　　在传统的神经网络中，比如多层感知机（MLP），其输入通常是一个特征向量。需要人工设计特征，然后将用这些特征计算的值组成特征向量。在过去几十年的经验来看，人工找的特征并不总是好用。有时多了，有时少了，有时选的特征根本就不起作用（真正起作用的特征在浩瀚的未知里）。这就是为啥过去几十年神经网络一直被SVM等完虐的原因。　　如果有人说，任何特征都是从图像中提取的…

2023年4月5日
000
对Keras中predict()方法和predict_classes()方法的区别说明

首先，需要明确Keras是一个高级的深度学习框架，它封装了底层的深度学习工具，使得深度学习模型的构建、训练和测试变得更加简单易用。在Keras中，predict()和predict_classes()是两个常用的方法来进行模型预测，它们的区别如下。 predict()方法 predict()方法用于对给定的输入数据进行模型预测，并返回预测结果，返回的结果是一…

卷积神经网络 2023年5月15日
000
python神经网络Batch Normalization底层原理详解

下面是关于Python神经网络Batch Normalization底层原理详解的完整攻略。 Batch Normalization的原理 Batch Normalization是一种用于神经网络的技术，旨在加速训练过程并提高模型的准确性。Batch Normalization通过对每个批次的输入进行归一化来实现这一点，从而使网络更加稳定和可靠。 Batch…

卷积神经网络 2023年5月16日
000
深度学习原理与框架-卷积神经网络-cifar10分类(图片分类代码) 1.数据读入 2.模型构建 3.模型参数训练

卷积神经网络：下面要说的这个网络，由下面三层所组成卷积网络：卷积层 + 激活层relu+ 池化层max_pool组成神经网络：线性变化 + 激活层relu 神经网络：线性变化(获得得分值) 代码说明：代码主要有三部分组成第一部分：数据读入第二部分：模型的构建，用于生成loss和梯度值第三部分：将数据和模型输入，使用batch_size数据进…

卷积神经网络 2023年4月8日
000
Python机器学习从ResNet到DenseNet示例详解

那么下面是对“Python机器学习从ResNet到DenseNet示例详解”这篇攻略的详细讲解。文章概述这篇文章主要介绍了使用Python实现机器学习中常用的ResNet和DenseNet网络，并提供了相应的代码示例。文章分为两部分，第一部分介绍了ResNet网络的实现，第二部分介绍了DenseNet网络的实现。 ResNet示例说明 ResNet网络简…

卷积神经网络 2023年5月15日
000
卷积神经网络

【论文笔记】FCN全卷积网络

　　全卷积网络（FCN）是用于图片语义分割的一种卷积神经网络（CNN），由Jonathan Long，Evan Shelhamer 和Trevor Darrell提出，由此开启了深度学习在语义分割中的应用。语义分割是计算机视觉领域很重要的一个分支，在自动驾驶、地面检测等方面都起到很重要作用。与简单区分前景后景的图像分割技术不同，语义分割则不仅是区分每个像素的…

2023年4月5日
000
卷积神经网络

卷积神经网络 CNN

　　卷积神经网络与普通的神经网络十分相似：他们都由神经元构成，这些神经元拥有可学习的权重和偏差。每一个神经元接收一些输入，执行点积运算并以非线性可选择地跟随它。整个网络仍然表征一个单个可微分的分数函数：从一端的单个图片像素到另一端的类别分数。他们在最后一个（全连接）层上仍然有一个损失函数（例如SVM或Softmax），并且我们为学习常规神经网络而设计的所有提…

2023年4月6日
000
用python wxpy管理微信公众号并利用微信获取自己的开源数据

下面是用Python wxpy管理微信公众号并利用微信获取自己的开源数据的完整攻略。 1. 安装wxpy 首先，我们需要安装wxpy。wxpy是一个开源的微信个人号API，基于python的封装，实现了与微信公众号接口的交互，可以用于快速地开发微信机器人。我们可以通过pip命令来安装wxpy： pip install -U wxpy 2. 登录微信账号安…

卷积神经网络 2023年5月15日
000

人工智能学习PyTorch教程之层和块

1. PyTorch中的层和块

2. 利用层和块实现一个简单的神经网络分类器

3. 利用层和块实现一个深度神经网络分类器

相关文章