requires_grad_()与requires_grad的区别,同时pytorch的自动求导(AutoGrad)

2023年4月6日下午4:29 • PyTorch

1. 所有的tensor都有.requires_grad属性,可以设置这个属性.

　　　　x = tensor.ones(2,4,requires_grad=True)

2.如果想改变这个属性，就调用tensor.requires_grad_()方法：

　　 x.requires_grad_(False)

3.自动求导注意点:

　　(1) 要想使x支持求导，必须让x为浮点类型;

　　(2) 求导，只能是【标量】对标量，或者【标量】对向量/矩阵求导;

　　(3) 不是标量也可以用backward()函数来求导;

　　(4) 　一般来说，我是对标量求导，比如在神经网络里面，我们的loss会是一个标量，那么我们让loss对神经网络的参数w求导，直接通过loss.backward()即可。

　　　　　　但是，有时候我们可能会有多个输出值，比如loss=[loss1,loss2,loss3]，那么我们可以让loss的各个分量分别对x求导，这个时候就采用：
　　　　　　　　loss.backward(torch.tensor([[1.0,1.0,1.0,1.0]]))

　　　　　　如果你想让不同的分量有不同的权重，那么就赋予gradients不一样的值即可，比如：
　　　　　　　　　　loss.backward(torch.tensor([[0.1,1.0,10.0,0.001]]))

　　　　　　这样，我们使用起来就更加灵活了，虽然也许多数时候，我们都是直接使用.backward()就完事儿了。

　　(5)一个计算图只能backward一次,改善方法:retain_graph=True

　　　　但是这样会吃内存！，尤其是，你在大量迭代进行参数更新的时候，很快就会内存不足，memory out了。

引自:

　　https://www.jianshu.com/p/a105858567df

　　

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：requires_grad_()与requires_grad的区别,同时pytorch的自动求导(AutoGrad) - Python技术站

pytorch 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

pytorch中的select by mask

上一篇 2023年4月6日

关于Pytorch报警告：Warning: indexing with dtype torch.uint8 is now deprecated, please use a dtype torch.bool instead

下一篇 2023年4月6日

机器学习中矩阵的求导知识

矩阵求导公式在学习机器学习线性回归时，遇到矩阵求导的问题。

机器学习 2023年4月13日
000
生成对抗网络GAN（四）基于GAN的行人重识别

一、基于GAN的ReID方法行人重识别（Person re-identification,ReID）也称行人再识别，是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。ReID一个问题就是数据匮乏，CVPR18之前最大的ReID数据集也就小几千个ID，几万张图片（序列假定只算一张）。因此在ICCV17 GAN造图做ReID挖了第一个坑之后，就…

GAN生成对抗网络 2023年4月7日
000
利用PyTorch实现VGG16教程

利用PyTorch实现VGG16教程 VGG16是一种非常流行的深度学习模型，可以用于图像分类和目标检测等任务。本文将介绍如何使用PyTorch实现VGG16，并提供两个示例说明。下载数据集在实现VGG16之前，我们需要先下载一个数据集。我们可以使用ImageNet数据集，该数据集包含超过100万张图像，用于训练深度学习模型。我们可以使用以下命令下载数据…

PyTorch 2023年5月16日
000
Python中if __name__ == ‘__main__’作用解析

在Python中，if __name__ == ‘__main__’是一个常见的代码块，它通常用于判断当前模块是否是主程序入口。在本文中，我们将详细讲解if __name__ == ‘__main__’的作用和用法，并提供两个示例说明。 if __name__ == ‘__main__’的作用在Python中，每个模块都有一个内置的变量__name__，它…

PyTorch 2023年5月15日
000
卷积神经网络

利用Tensorflow实现卷积神经网络模型

首先看一下卷积神经网络模型，如下图：卷积神经网络（CNN）由输入层、卷积层、激活函数、池化层、全连接层组成，即INPUT-CONV-RELU-POOL-FC池化层：为了减少运算量和数据维度而设置的一种层。代码如下： n_input = 784 # 28*28的灰度图 n_output = 10 # 完成一个10分类的操作 weights = { #’…

2023年4月8日
000
Pytorch之parameters的使用

PyTorch之parameters的使用在使用PyTorch进行深度学习开发时，我们经常需要对模型的参数进行操作，例如初始化、保存和加载等。本文将介绍如何使用PyTorch的parameters模块来进行参数操作，并演示两个示例。示例一：初始化模型参数 import torch # 定义一个模型 class Model(torch.nn.Module)…

PyTorch 2023年5月15日
000
PyTorch

PyTorch项目使用TensorboardX进行训练可视化

什么是TensorboardX Tensorboard 是 TensorFlow 的一个附加工具，可以记录训练过程的数字、图像等内容，以方便研究人员观察神经网络训练过程。可是对于 PyTorch 等其他神经网络训练框架并没有功能像 Tensorboard 一样全面的类似工具，一些已有的工具功能有限或使用起来比较困难 (tensorboard_logger, …

2023年4月8日
000
pytorch使用horovod多gpu训练的实现

PyTorch使用Horovod多GPU训练的实现 Horovod是一种用于分布式深度学习的开源框架，可以在多个GPU或多个计算节点上并行训练模型。在本文中，我们将介绍如何使用PyTorch和Horovod来实现多GPU训练，并提供两个示例，分别是使用Horovod进行图像分类和使用Horovod进行文本分类。安装Horovod 在使用Horovod之前，…

PyTorch 2023年5月15日
000

合作推广

合作推广

返回顶部