pytorch 中的grid_sample和affine_grid

2023年4月8日上午12:39 • PyTorch

pytorch 中提供了对Tensor进行Crop的方法，可以使用GPU实现。具体函数是torch.nn.functional.affine_grid和torch.nn.functional.grid_sample。前者用于生成二维网格，后者对输入Tensor按照网格进行双线性采样。

grid_sample函数中将图像坐标归一化到([-1, 1])，其中0对应-1，width-1对应1。

affine_grid的输入是仿射矩阵(Nx2x3)和输出Tensor的尺寸(Tensor.Size(NxHxWx2))，输出的是归一化的二维网格。

在Faster R CNN中，用到了Crop Pooling，需要在feature map 中裁剪出与proposal region 对应的部分，可以使用这两个函数实现。具体参考 http://www.telesens.co/2018/03/11/object-detection-and-classification-using-r-cnns/#ITEM-1455-4

pytorch 中的grid_sample和affine_grid

下面进行简单的实验：

首先生成一个1x1x5x5的Tensor变量
裁剪窗口为x1 = 2.5, x2 = 4.5, y1 = 0.5, y2 = 3.5，size为1x1x3x2，根据坐标设置theta矩阵
进行裁剪，并与numpy计算结果相比较。

a = torch.rand((1, 1, 5, 5))
print(a)

# x1 = 2.5, x2 = 4.5, y1 = 0.5, y2 = 3.5
# out_w = 2, out_h = 3
size = torch.Size((1, 1, 3, 2))
print(size)

# theta
theta_np = np.array([[0.5, 0, 0.75], [0, 0.75, 0]]).reshape(1, 2, 3)
theta = torch.from_numpy(theta_np)
print('theta:')
print(theta)
print()

flowfield = torch.nn.functional.affine_grid(theta, size)
sampled_a = torch.nn.functional.grid_sample(a, flowfield.to(torch.float32))
sampled_a = sampled_a.numpy().squeeze()
print('sampled_a:')
print(sampled_a)

# compute bilinear at (0.5, 2.5), using (0, 3), (0, 4), (1, 3), (1, 4)
# quickly compute(https://blog.csdn.net/lxlclzy1130/article/details/50922867)
print()
coeff = np.array([[0.5, 0.5]])
A = a[0, 0, 0:2, 2:2+2]
print('torch sampled at (0.5, 3.5): %.4f' % sampled_a[0,0])
print('numpy compute: %.4f' % np.dot(np.dot(coeff, A), coeff.T).squeeze())

运行结果为：
pytorch 中的grid_sample和affine_grid

可以看到结果是相同的

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：pytorch 中的grid_sample和affine_grid - Python技术站

pytorch 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

pytorch使用horovod多gpu训练

上一篇 2023年4月8日

贝叶斯个性化排序(BPR)pytorch实现

下一篇 2023年4月8日

Caffe 层

卷积神经网络（Convolutional Neural Network, CNN）是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，[1]对于大型图像处理有出色表现。 Deep Neural Network（DNN）模型是基本的深度学习框架递归神经网络（RNN）是两种人工神经网络的总称。一种是时间递归神经网络（recurrent neu…

Caffe 2023年4月6日
000
机器学习技法之随机森林（Random Forest）

森林顾名思义就是有很多树，这里的树当然就是决策树。实际上随机森林就是将 fully-grown C&RT decision tree 作为 bagging 基模型（base model）。 \[\text{random forest (RF) = bagging + fully-grown C\&RT decision tree} \] ba…

机器学习 2023年4月10日
000
[winograd]winograd算法在卷积中的应用

在卷积神经网络当中, 卷积运算是尤其是计算敏感的, 尤其是在端上设备中, 对于性能的要求更为苛刻。对于卷积优化的方法也有很多种，本文便针对近年来最常见的优化方法Winograd做一个简单总结。相关资料 winograd算法最早是1980年由Terry Winograd提出的，当时并没有引起太大的轰动。在CVPR’16会议上，Lavin等人[1]提出了利用w…

卷积神经网络 2023年4月6日
000
对比学习:《深度学习之Pytorch》《PyTorch深度学习实战》+代码

PyTorch是一个基于Python的深度学习平台，该平台简单易用上手快，从计算机视觉、自然语言处理再到强化学习，PyTorch的功能强大，支持PyTorch的工具包有用于自然语言处理的Allen NLP，用于概率图模型的Pyro，扩展了PyTorch的功能。通过学习《深度学习入门之PyTorch》，可以从机器学习和深度学习的基础理论入手，从零开始学习 Py…

PyTorch 2023年4月7日
000
目标检测

(目标检测) Mask R-CNN详解+论文复现

Mask R-CNN xyang声明：本篇文章借用了他人理解，如有侵权，请联系，另如需转载，请注明出处首发于：https://github.com/Bryce1010/Object-Detection-paper-recording/blob/master/5.Mask%20R-CNN.md arxiv: http://arxiv.org/abs/1703.…

2023年4月8日
000
超简单！pytorch入门教程（一）：Tensor

二、pytorch的基石–Tensor张量其实标量，向量，矩阵它们三个也是张量，标量是零维的张量，向量是一维的张量，矩阵是二维的张量。四种加法第一种： >>>a+b 第二种： >>>torch.add(a,b) 第三种： >>>result = torch.Tensor(5,3) >>…

PyTorch 2023年4月6日
000
卷积神经网络

卷积神经网络去雾去雨方法

卷积神经网络去雾去雨方法标题：A Convolutional Network for Joint Deraining and Dehazing from A Single Image for Autonomous Driving in Rain 作者：Hao Sun, Marcelo H. Ang Jr. and Daniela Rus 来源：IEEE/R…

2023年4月8日
000
目标检测

【学习笔记】三种POINT_BASED的二维目标检测方法的差异和发展

本文简要介绍了CornerNet，ExtremeNet，CenterNet三种POINT_BASED的二维目标检测方法的差异和发展 1 CornerNet paper，code利用卷积网络，对所有的左上角点生成一幅热力图，对所有右下角点生成一幅热力图，并且对所有检测到的角点生成一个嵌入式向量。训练网络将属于同一目标的角点预测成相同的嵌入式向量。该网络通过串联…

2023年4月8日
000

合作推广

合作推广

返回顶部