超简单！pytorch入门教程（二）：Autograd

2023年4月6日上午10:44 • PyTorch

yizhihongxing

一、autograd自动微分

autograd是专门为了BP算法设计的，所以这autograd只对输出值为标量的有用，因为损失函数的输出是一个标量。如果y是一个向量，那么backward()函数就会失效。不知道BP算法是什么的同学，估计也不知道什么是深度学习，建议先看Zen君提供的教材。

二、autograd的内部机理

variable是tensor的外包装，variable类型变量的data属性存储着tensor数据，grad属性存储关于该变量的导数，creator是代表该变量的创造者。

超简单！pytorch入门教程（二）：Autograd

数据向前传输和向后传输生成导数的过程示意图

如图，假设我们有一个输入变量input（数据类型为Variable）input是用户输入的，所以其创造者creator为null值，input经过第一个数据操作operation1（比如加减乘除运算）得到output1变量（数据类型仍为Variable），这个过程中会自动生成一个function1的变量（数据类型为Function的一个实例），而output1的创造者就是这个function1。随后，output1再经过一个数据操作生成output2，这个过程也会生成另外一个实例function2，output2的创造者creator为function2。

在这个向前传播的过程中，function1和function2记录了数据input的所有操作历史，当output2运行其backward函数时，会使得function2和function1自动反向计算input的导数值并存储在grad属性中。

creator为null的变量才能被返回导数，比如input，若把整个操作流看成是一张图（Graph）,那么像input这种creator为null的被称之为图的叶子（graph leaf）。而creator非null的变量比如output1和output2，是不能被返回导数的，它们的grad均为0。所以只有叶子节点才能被autograd。


作者：Zen_君

链接：http://www.jianshu.com/p/cbce2dd60120
來源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：超简单！pytorch入门教程（二）：Autograd - Python技术站

pytorch 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

超简单！pytorch入门教程（一）：Tensor

上一篇 2023年4月6日

PyTorch深度学习：60分钟入门(Translation)

下一篇 2023年4月6日

循环神经网络

【深度学习】RNN（循环神经网络）

1 循环神经网络（RNN）概念循环神经网络，是一种线性序列结构，前一个神经元的结果会传递给后一个神经元。递归神经网络，是一种层次结构，前一个神经元会影响后一个神经元，后一个神经元同样也会影响前一个神经元。循环神经网络是递归神经网络中的一种特殊情况，因为线性结构是层次结构的一种特例。 2 RNN结构 2.1 误差传播为什么容易消失或放大 1）如果采用线性*…

2023年4月6日
000
机器学习第三练：为慈善机构寻找捐助者

这个任务同样是在Jupyter Notebook中完成，项目目的是通过前面的所有特征列，当然去掉序号列，然后预测最后一列，收入’income’，究竟是大于50K，还是小于等于50K. 第一步，探索数据，像探索性统计里经常涉及到的频数，均值，众数或者众位数相关的计算，我们通过这些统计指标，使用python来看一下数据的大概情况这块主要还是涉及pan…

机器学习 2023年4月11日
000
卷积神经网络

论文（卷积数据流）-Communication Lower Bound in Convolution Accelerators

目录 1. Introduction 2. Background 2.1 Convolutional Layers 2.2 Related Work 2.3 Preliminary: Red-blue Pebble Game（红蓝卵石游戏） 3.Layer-wise lower bound of off-chip communication 3.1 Rela…

2023年4月8日
000
tensorflow

tensorflow高级库 tflearn skflow

国内只看skflow不见tflearn 在github上搜索tflearn有2700多的星星，skflow 2400多星星，低于tflearn，用百度搜索tflearn压根没有结果，在博客园内搜索也只看到了一篇存储连接的博客涉及tflearn。在这里把这个库介绍给大家，完善的教程：http://tflearn.org/ 它有更多的案例可以参考： http…

2023年4月8日
000
Keras官方中文文档：keras后端Backend

所属分类：Keras 什么是“后端” Keras是一个模型级的库，提供了快速构建深度学习网络的模块。Keras并不处理如张量乘法、卷积等底层操作。这些操作依赖于某种特定的、优化良好的张量操作库。Keras依赖于处理张量的库就称为“后端引擎”。Keras提供了三种后端引擎Theano/Tensorflow/CNTK，并将其函数统一封装，使得用户可以以同一个接口…

Keras 2023年4月6日
000
机器学习算法–聚类

聚类试图将数据集中的样本划分为若干个通常不相交的子集，每个子集称为一个“簇”。通常为“无监督学习”，对无标记训练样本学习来揭示数据的内在规律和性质。下面主要讲三种聚类模型： 1. 原型聚类 “原型”是指样本空间中具有代表性的点。通常是算法先对原型进行初始化，然后对原型进行迭代更新求解。介绍三种著名的原型聚类方法。（1）…

机器学习 2023年4月10日
000
循环神经网络

1.3 循环神经网络模型-深度学习第五课《序列模型》-Stanford吴恩达教授

循环神经网络模型 (Recurrent Neural Network Model) 上节视频中，你了解了我们用来定义序列学习问题的符号。现在我们讨论一下怎样才能建立一个模型，建立一个神经网络来学习 XXX 到 YYY 的映射。可以尝试的方法之一是使用标准神经网络，在我们之前的例子中，我们有9个输入单词。想象一下，把这9个输入单词，可能是9个one-hot向…

2023年4月8日
000
【强化学习】使用off-policy算法机器人抓取任务基准；生成对抗网络 GAN 就是强化学习

本文转自雷克世界（ID：raicworld）编译 | 嗯~阿童木呀在本文中，我们探讨了用于基于视觉的机器人抓取操作的深度强化学习算法。无模型深度强化学习（RL）已经在一系列具有挑战性的环境中得到了成功应用，但算法的激增使得我们难以辨别出哪种特定的方法最适合于执行一个丰富的、多样化的任务，例如抓取。为了回答这一问题，我们提出了一个机器人抓取的模拟基准，强调…

GAN生成对抗网络 2023年4月6日
000

合作推广

合作推广

返回顶部