PyTorch一小时掌握之图像识别实战篇

yizhihongxing

PyTorch一小时掌握之图像识别实战篇

本文将介绍如何使用PyTorch进行图像识别任务。我们将提供两个示例,分别是手写数字识别和猫狗分类。

手写数字识别

手写数字识别是一个经典的图像识别任务。以下是一个简单的手写数字识别示例:

import torch
import torch.nn as nn
import torchvision.datasets as dsets
import torchvision.transforms as transforms

# 定义超参数
input_size = 784
hidden_size = 500
num_classes = 10
num_epochs = 5
batch_size = 100
learning_rate = 0.001

# 加载MNIST数据集
train_dataset = dsets.MNIST(root='./data', train=True, transform=transforms.ToTensor(), download=True)
test_dataset = dsets.MNIST(root='./data', train=False, transform=transforms.ToTensor())

# 加载数据集
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)
test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False)

# 定义模型
model = nn.Sequential(
    nn.Linear(input_size, hidden_size),
    nn.ReLU(),
    nn.Linear(hidden_size, num_classes)
)

# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

# 训练模型
total_step = len(train_loader)
for epoch in range(num_epochs):
    for i, (images, labels) in enumerate(train_loader):
        images = images.reshape(-1, 28*28)

        # 前向传播
        outputs = model(images)
        loss = criterion(outputs, labels)

        # 反向传播和优化
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if (i+1) % 100 == 0:
            print ('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'.format(epoch+1, num_epochs, i+1, total_step, loss.item()))

# 测试模型
with torch.no_grad():
    correct = 0
    total = 0
    for images, labels in test_loader:
        images = images.reshape(-1, 28*28)
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

    print('Accuracy of the model on the 10000 test images: {} %'.format(100 * correct / total))

在这个示例中,我们首先定义了超参数,然后加载了MNIST数据集。接下来,我们定义了一个名为model的模型,并定义了一个名为criterion的损失函数和一个名为optimizer的优化器。然后,我们使用训练数据对模型进行了训练,并在每个epoch结束时输出损失值。最后,我们使用测试数据对模型进行了测试,并输出了模型的准确率。

猫狗分类

猫狗分类是一个常见的图像识别任务。以下是一个简单的猫狗分类示例:

import torch
import torch.nn as nn
import torchvision.datasets as dsets
import torchvision.transforms as transforms
import torchvision.models as models

# 定义超参数
num_epochs = 5
batch_size = 100
learning_rate = 0.001

# 加载数据集
train_dataset = dsets.ImageFolder(root='./data/train', transform=transforms.Compose([
    transforms.Resize(224),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
]))
test_dataset = dsets.ImageFolder(root='./data/test', transform=transforms.Compose([
    transforms.Resize(224),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
]))
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)
test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False)

# 加载预训练模型
model = models.resnet18(pretrained=True)
num_ftrs = model.fc.in_features
model.fc = nn.Linear(num_ftrs, 2)

# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

# 训练模型
total_step = len(train_loader)
for epoch in range(num_epochs):
    for i, (images, labels) in enumerate(train_loader):
        # 前向传播
        outputs = model(images)
        loss = criterion(outputs, labels)

        # 反向传播和优化
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if (i+1) % 100 == 0:
            print ('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'.format(epoch+1, num_epochs, i+1, total_step, loss.item()))

# 测试模型
with torch.no_grad():
    correct = 0
    total = 0
    for images, labels in test_loader:
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

    print('Accuracy of the model on the test images: {} %'.format(100 * correct / total))

在这个示例中,我们首先定义了超参数,然后加载了猫狗分类数据集。接下来,我们加载了一个预训练的ResNet18模型,并将其输出层替换为一个名为fc的线性层。然后,我们定义了一个名为criterion的损失函数和一个名为optimizer的优化器。然后,我们使用训练数据对模型进行了训练,并在每个epoch结束时输出损失值。最后,我们使用测试数据对模型进行了测试,并输出了模型的准确率。

结论

在本文中,我们介绍了如何使用PyTorch进行图像识别任务,并提供了两个示例说明。如果您遵循这些步骤和示例,您应该能够在PyTorch中实现手写数字识别和猫狗分类任务。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:PyTorch一小时掌握之图像识别实战篇 - Python技术站

(0)
上一篇 2023年5月16日
下一篇 2023年5月16日

相关文章

  • Pytorch中的广播机制详解(Broadcast)

    PyTorch中的广播机制详解(Broadcast) 在PyTorch中,广播机制(Broadcast)是一种非常重要的机制,它可以使得不同形状的张量进行数学运算。本文将详细介绍PyTorch中的广播机制,包括广播规则、广播示例和广播注意事项等。 广播规则 广播机制是一种自动扩展张量形状的机制,使得不同形状的张量可以进行数学运算。在PyTorch中,广播规则…

    PyTorch 2023年5月15日
    00
  • Pytorch学习笔记12—- Pytorch的LSTM的理解及入门小案例

    1.LSTM模型参数说明 class torch.nn.LSTM(*args, **kwargs) 参数列表 input_size:x的特征维度 hidden_size:隐藏层的特征维度 num_layers:lstm隐层的层数,默认为1 bias:False则bih=0和bhh=0. 默认为True batch_first:True则输入输出的数据格式为 …

    PyTorch 2023年4月8日
    00
  • Yolov5训练意外中断后如何接续训练详解

    当YOLOv5的训练意外中断时,我们可以通过接续训练来恢复训练过程,以便继续训练模型。下面是接续训练的详细步骤: 首先,我们需要保存当前训练的状态。我们可以使用PyTorch提供的torch.save()函数将模型的参数和优化器的状态保存到文件中。例如,我们可以使用以下代码将模型的参数和优化器的状态保存到文件checkpoint.pth中: torch.sa…

    PyTorch 2023年5月15日
    00
  • pytorch torchversion自带的数据集

        from torchvision.datasets import MNIST # import torchvision # torchvision.datasets. #准备数据集 mnist = MNIST(root=”./mnist”,train=True,download=True) print(mnist) mnist[0][0].show(…

    2023年4月8日
    00
  • pytorch dataloader num_workers

    https://discuss.pytorch.org/t/guidelines-for-assigning-num-workers-to-dataloader/813/5 num_workers 影响机器性能

    PyTorch 2023年4月7日
    00
  • python使用torch随机初始化参数

    在深度学习中,随机初始化参数是非常重要的。本文提供一个完整的攻略,以帮助您了解如何在Python中使用PyTorch随机初始化参数。 方法1:使用torch.nn.init 在PyTorch中,您可以使用torch.nn.init模块来随机初始化参数。torch.nn.init模块提供了多种初始化方法,包括常见的Xavier初始化和Kaiming初始化。您可…

    PyTorch 2023年5月15日
    00
  • Pytorch中Tensor与各种图像格式的相互转化详解

    在PyTorch中,可以使用各种方法将Tensor与各种图像格式相互转换。以下是两个示例说明,介绍如何在PyTorch中实现Tensor与各种图像格式的相互转化。 示例1:将Tensor转换为PIL图像 import torch import torchvision.transforms as transforms from PIL import Image…

    PyTorch 2023年5月16日
    00
  • Pyinstaller打包Pytorch框架所遇到的问题

    目录 前言 基本流程 一、安装Pyinstaller 和 测试Hello World 二、打包整个项目,在本机上调试生成exe 三、在新电脑上测试 参考资料 前言   第一次尝试用Pyinstaller打包Pytorch,碰见了很多问题,耗费了许多时间!想把这个过程中碰到的问题与解决方法记录一下,方便后来者。 基本流程   使用Pyinstaller打包流程…

    2023年4月8日
    00
合作推广
合作推广
分享本页
返回顶部