PyTorch一小时掌握之图像识别实战篇

PyTorch一小时掌握之图像识别实战篇

本文将介绍如何使用PyTorch进行图像识别任务。我们将提供两个示例,分别是手写数字识别和猫狗分类。

手写数字识别

手写数字识别是一个经典的图像识别任务。以下是一个简单的手写数字识别示例:

import torch
import torch.nn as nn
import torchvision.datasets as dsets
import torchvision.transforms as transforms

# 定义超参数
input_size = 784
hidden_size = 500
num_classes = 10
num_epochs = 5
batch_size = 100
learning_rate = 0.001

# 加载MNIST数据集
train_dataset = dsets.MNIST(root='./data', train=True, transform=transforms.ToTensor(), download=True)
test_dataset = dsets.MNIST(root='./data', train=False, transform=transforms.ToTensor())

# 加载数据集
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)
test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False)

# 定义模型
model = nn.Sequential(
    nn.Linear(input_size, hidden_size),
    nn.ReLU(),
    nn.Linear(hidden_size, num_classes)
)

# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

# 训练模型
total_step = len(train_loader)
for epoch in range(num_epochs):
    for i, (images, labels) in enumerate(train_loader):
        images = images.reshape(-1, 28*28)

        # 前向传播
        outputs = model(images)
        loss = criterion(outputs, labels)

        # 反向传播和优化
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if (i+1) % 100 == 0:
            print ('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'.format(epoch+1, num_epochs, i+1, total_step, loss.item()))

# 测试模型
with torch.no_grad():
    correct = 0
    total = 0
    for images, labels in test_loader:
        images = images.reshape(-1, 28*28)
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

    print('Accuracy of the model on the 10000 test images: {} %'.format(100 * correct / total))

在这个示例中,我们首先定义了超参数,然后加载了MNIST数据集。接下来,我们定义了一个名为model的模型,并定义了一个名为criterion的损失函数和一个名为optimizer的优化器。然后,我们使用训练数据对模型进行了训练,并在每个epoch结束时输出损失值。最后,我们使用测试数据对模型进行了测试,并输出了模型的准确率。

猫狗分类

猫狗分类是一个常见的图像识别任务。以下是一个简单的猫狗分类示例:

import torch
import torch.nn as nn
import torchvision.datasets as dsets
import torchvision.transforms as transforms
import torchvision.models as models

# 定义超参数
num_epochs = 5
batch_size = 100
learning_rate = 0.001

# 加载数据集
train_dataset = dsets.ImageFolder(root='./data/train', transform=transforms.Compose([
    transforms.Resize(224),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
]))
test_dataset = dsets.ImageFolder(root='./data/test', transform=transforms.Compose([
    transforms.Resize(224),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
]))
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)
test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False)

# 加载预训练模型
model = models.resnet18(pretrained=True)
num_ftrs = model.fc.in_features
model.fc = nn.Linear(num_ftrs, 2)

# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

# 训练模型
total_step = len(train_loader)
for epoch in range(num_epochs):
    for i, (images, labels) in enumerate(train_loader):
        # 前向传播
        outputs = model(images)
        loss = criterion(outputs, labels)

        # 反向传播和优化
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if (i+1) % 100 == 0:
            print ('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'.format(epoch+1, num_epochs, i+1, total_step, loss.item()))

# 测试模型
with torch.no_grad():
    correct = 0
    total = 0
    for images, labels in test_loader:
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

    print('Accuracy of the model on the test images: {} %'.format(100 * correct / total))

在这个示例中,我们首先定义了超参数,然后加载了猫狗分类数据集。接下来,我们加载了一个预训练的ResNet18模型,并将其输出层替换为一个名为fc的线性层。然后,我们定义了一个名为criterion的损失函数和一个名为optimizer的优化器。然后,我们使用训练数据对模型进行了训练,并在每个epoch结束时输出损失值。最后,我们使用测试数据对模型进行了测试,并输出了模型的准确率。

结论

在本文中,我们介绍了如何使用PyTorch进行图像识别任务,并提供了两个示例说明。如果您遵循这些步骤和示例,您应该能够在PyTorch中实现手写数字识别和猫狗分类任务。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:PyTorch一小时掌握之图像识别实战篇 - Python技术站

(0)
上一篇 2023年5月16日
下一篇 2023年5月16日

相关文章

  • PyTorch如何创建自己的数据集

    PyTorch如何创建自己的数据集 在本文中,我们将介绍如何使用PyTorch创建自己的数据集,以便在深度学习模型中使用。我们将提供两个示例,一个是图像数据集,另一个是文本数据集。 示例1:创建图像数据集 以下是一个创建图像数据集的示例代码: import torch from torch.utils.data import Dataset, DataLoa…

    PyTorch 2023年5月16日
    00
  • PyTorch模型保存与加载实例详解

    PyTorch模型保存与加载实例详解 在PyTorch中,模型的保存和加载是深度学习开发中的重要任务之一。本文将介绍如何使用PyTorch保存和加载模型,并演示两个示例。 保存模型 在PyTorch中,可以使用torch.save()函数将模型保存到磁盘上。torch.save()函数接受两个参数:要保存的对象和文件路径。下面是一个示例代码: import …

    PyTorch 2023年5月15日
    00
  • linux或windows环境下pytorch的安装与检查验证(解决runtimeerror问题)

    下面是在Linux或Windows环境下安装和验证PyTorch的完整攻略,包括两个示例说明。 1. 安装PyTorch 1.1 Linux环境下安装PyTorch 在Linux环境下安装PyTorch,可以使用pip命令或conda命令进行安装。以下是使用pip命令安装PyTorch的步骤: 安装pip 如果您的系统中没有安装pip,请使用以下命令安装: …

    PyTorch 2023年5月15日
    00
  • pytorch的.item()方法

    python的.item()用于将字典中每对key和value组成一个元组,并把这些元组放在列表中返回例如person={‘name’:‘lizhong’,‘age’:‘26’,‘city’:‘BeiJing’,‘blog’:‘www.jb51.net’} for key,value in person.items():print ‘key=’,key,’,…

    PyTorch 2023年4月8日
    00
  • python调用pytorch实现deeplabv3+图像语义分割——以分割动漫人物为例

    图像语义分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。本文提供了一个可进行自定义数据集训练基于pytorch的deeplabv3+图像分割模型的方法,训练了一个动漫人物分割模型,不过数据集较小,仅供学习使用 程序输入:动漫图片 程序输出:分割好的动漫人物图片 目录 程序简介 程序/数据集下载 数据集准备 训练步骤 预测演示步…

    2023年4月8日
    00
  • [PyTorch 学习笔记] 2.2 图片预处理 transforms 模块机制

    我们在安装PyTorch时,还安装了torchvision,这是一个计算机视觉工具包。有 3 个主要的模块: torchvision.transforms: 里面包括常用的图像预处理方法 torchvision.datasets: 里面包括常用数据集如 mnist、CIFAR-10、Image-Net 等 torchvision.models: 里面包括常用…

    2023年4月6日
    00
  • pytorch使用tensorboardX进行loss可视化实例

    PyTorch使用TensorboardX进行Loss可视化实例 在PyTorch中,我们可以使用TensorboardX库将训练过程中的Loss可视化。本文将介绍如何使用TensorboardX库进行Loss可视化,并提供两个示例说明。 1. 安装TensorboardX 要使用TensorboardX库,我们需要先安装它。可以使用以下命令在终端中安装Te…

    PyTorch 2023年5月15日
    00
  • 转:pytorch优化器传入多个模型的参数

    pytorch 优化器(optim)不同参数组,不同学习率设置  

    PyTorch 2023年4月7日
    00
合作推广
合作推广
分享本页
返回顶部