pytorch人工智能之torch.gather算子用法示例

yizhihongxing

PyTorch人工智能之torch.gather算子用法示例

torch.gather是PyTorch中的一个重要算子,用于在指定维度上收集输入张量中指定索引处的值。在本文中,我们将介绍torch.gather的用法,并提供两个示例说明。

torch.gather的用法

torch.gather的语法如下:

torch.gather(input, dim, index, out=None)

其中,参数含义如下:

  • input:输入张量。
  • dim:指定维度。
  • index:索引张量。
  • out:输出张量。

torch.gather的作用是在input张量的dim维度上,根据index张量中的索引,收集input张量中对应位置的值,并将结果存储在输出张量out中。

示例1:使用torch.gather实现分类任务

下面是一个示例,演示了如何使用torch.gather实现分类任务:

import torch
import torch.nn as nn
import torch.optim as optim
import torchvision

# 定义模型
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.conv1(x)
        x = torch.relu(x)
        x = self.pool(x)
        x = self.conv2(x)
        x = torch.relu(x)
        x = self.pool(x)
        x = x.view(-1, 16 * 5 * 5)
        x = self.fc1(x)
        x = torch.relu(x)
        x = self.fc2(x)
        x = torch.relu(x)
        x = self.fc3(x)
        return x

# 加载数据集,并使用DataLoader创建数据加载器
train_dataset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=torchvision.transforms.ToTensor())
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=128, shuffle=True)

# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)

# 进行模型训练
for epoch in range(10):
    for i, (inputs, targets) in enumerate(train_loader):
        optimizer.zero_grad()
        outputs = net(inputs)
        loss = criterion(outputs, targets)
        loss.backward()
        optimizer.step()

        # 打印训练日志
        print('Epoch: %d, Batch: %d, Loss: %.4f' % (epoch+1, i+1, loss.item()))

    # 在测试集上测试模型
    test_dataset = torchvision.datasets.CIFAR10(root='./data', train=False, download=True, transform=torchvision.transforms.ToTensor())
    test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=128, shuffle=False)
    correct = 0
    total = 0
    with torch.no_grad():
        for inputs, targets in test_loader:
            outputs = net(inputs)
            _, predicted = torch.max(outputs.data, 1)
            total += targets.size(0)
            correct += (predicted == targets).sum().item()

    # 打印测试日志
    print('Epoch: %d, Test Accuracy: %.2f%%' % (epoch+1, 100 * correct / total))

在这个示例中,我们首先定义了一个包含卷积层、池化层、全连接层等的卷积神经网络。然后,我们加载了CIFAR10数据集,并使用DataLoader创建了数据加载器。然后,我们定义了一个交叉熵损失函数和一个SGD优化器。最后,我们进行了模型训练,并在测试集上测试了模型的泛化能力。

示例2:使用torch.gather实现双线性插值

下面是一个示例,演示了如何使用torch.gather实现双线性插值:

import torch

def bilinear_interpolate(im, x, y):
    # 获取图像大小
    _, _, h, w = im.size()

    # 计算四个相邻像素的坐标
    x0 = torch.floor(x).long()
    x1 = x0 + 1
    y0 = torch.floor(y).long()
    y1 = y0 + 1

    # 确保坐标不超出图像范围
    x0 = torch.clamp(x0, 0, w-1)
    x1 = torch.clamp(x1, 0, w-1)
    y0 = torch.clamp(y0, 0, h-1)
    y1 = torch.clamp(y1, 0, h-1)

    # 计算四个相邻像素的权重
    wa = (x1.float() - x) * (y1.float() - y)
    wb = (x1.float() - x) * (y - y0.float())
    wc = (x - x0.float()) * (y1.float() - y)
    wd = (x - x0.float()) * (y - y0.float())

    # 收集四个相邻像素的值,并进行双线性插值
    Ia = im[:, :, y0, x0]
    Ib = im[:, :, y1, x0]
    Ic = im[:, :, y0, x1]
    Id = im[:, :, y1, x1]
    out = wa.unsqueeze(1) * Ia + wb.unsqueeze(1) * Ib + wc.unsqueeze(1) * Ic + wd.unsqueeze(1) * Id

    return out

# 创建输入张量
im = torch.randn(1, 3, 4, 4)

# 创建坐标张量
x = torch.tensor([0.5, 1.5, 2.5, 3.5])
y = torch.tensor([0.5, 1.5, 2.5, 3.5])

# 进行双线性插值
out = bilinear_interpolate(im, x, y)

# 打印结果
print(out)

在这个示例中,我们首先定义了一个bilinear_interpolate函数,用于实现双线性插值。然后,我们创建了一个输入张量im和一个坐标张量xy。最后,我们使用torch.gather实现了双线性插值,并打印了结果。

总结

本文介绍了torch.gather算子的用法,并提供了两个示例说明。在实现过程中,我们使用torch.gather实现了分类任务和双线性插值,展示了torch.gather的强大功能。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:pytorch人工智能之torch.gather算子用法示例 - Python技术站

(0)
上一篇 2023年5月15日
下一篇 2023年5月15日

相关文章

  • python机器学习pytorch自定义数据加载器

    Python机器学习PyTorch自定义数据加载器 PyTorch是一个基于Python的科学计算库,它支持GPU加速的张量计算,提供了丰富的神经网络模块,可以帮助我们快速构建和训练深度学习模型。在PyTorch中,我们可以使用自定义数据加载器来加载自己的数据集,这样可以更好地适应不同的数据格式和数据预处理方式。本文将详细讲解如何使用PyTorch自定义数据…

    PyTorch 2023年5月16日
    00
  • 在pytorch中计算准确率,召回率和F1值的操作

    在PyTorch中,我们可以使用混淆矩阵来计算准确率、召回率和F1值。混淆矩阵是一个二维矩阵,用于比较模型的预测结果和真实标签。下面是一个简单的示例,演示如何使用混淆矩阵计算准确率、召回率和F1值。 示例一:二分类问题 在二分类问题中,混淆矩阵包含四个元素:真正例(True Positive,TP)、假正例(False Positive,FP)、真反例(Tr…

    PyTorch 2023年5月15日
    00
  • 【笔记】PyTorch快速入门:基础部分合集

    一天时间快速上手PyTorch PyTorch快速入门 Tensors Tensors贯穿PyTorch始终 和多维数组很相似,一个特点是可以硬件加速 Tensors的初始化 有很多方式 直接给值 data = [[1,2],[3,4]] x_data = torch.tensor(data) 从NumPy数组转来 np_arr = np.array(dat…

    2023年4月8日
    00
  • pytorch使用horovod多gpu训练

    pytorch在Horovod上训练步骤分为以下几步: import torch import horovod.torch as hvd # Initialize Horovod 初始化horovod hvd.init() # Pin GPU to be used to process local rank (one GPU per process) 分配到…

    PyTorch 2023年4月8日
    00
  • Pytorch中expand()的使用(扩展某个维度)

    PyTorch中expand()的使用(扩展某个维度) 在PyTorch中,expand()函数可以用来扩展张量的某个维度,从而实现张量的形状变换。expand()函数会自动复制张量的数据,以填充新的维度。下面是expand()函数的详细使用方法: torch.Tensor.expand(*sizes) -> Tensor 其中,*sizes是一个可变…

    PyTorch 2023年5月15日
    00
  • Pytorch教程内置模型源码实现

    PyTorch是一个流行的深度学习框架,它提供了许多内置的模型,包括卷积神经网络、循环神经网络和生成对抗网络等。在本文中,我们将详细讲解如何使用PyTorch内置模型,并提供两个示例说明。 使用内置模型 PyTorch内置模型可以通过torchvision.models模块来访问。该模块提供了许多常用的模型,包括AlexNet、VGG、ResNet和Dens…

    PyTorch 2023年5月16日
    00
  • Pytorch 之损失函数

    1. torch.nn.MSELoss    均方损失函数,一般损失函数都是计算一个 batch 数据总的损失,而不是计算单个样本的损失。 $$L = (x – y)^{2}$$    这里 $L, x, y$ 的维度是一样的,可以是向量或者矩阵(有多个样本组合),这里的平方是针对 Tensor 的每个元素,即 $(x-y)**2$ 或 $torch.pow…

    2023年4月6日
    00
  • 【pytorch】带batch的tensor类型图像显示

    pytorch训练时我们一般把数据集放到数据加载器里,然后分批拿出来训练。训练前我们一般还要看一下训练数据长啥样,也就是训练数据集可视化。那么如何显示dataloader里面带batch的tensor类型的图像呢? 显示图像 绘图最常用的库就是matplotlib: pip install matplotlib 显示图像会用到matplotlib.pyplo…

    2023年4月7日
    00
合作推广
合作推广
分享本页
返回顶部