pytorch查看网络权重参数更新、梯度的小实例

2023年4月7日下午11:21 • PyTorch

本文内容来自知乎：浅谈 PyTorch 中的 tensor 及使用

首先创建一个简单的网络，然后查看网络参数在反向传播中的更新，并查看相应的参数梯度。

# 创建一个很简单的网络：两个卷积层，一个全连接层
class Simple(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d(3, 16, 3, 1, padding=1, bias=False)
        self.conv2 = nn.Conv2d(16, 32, 3, 1, padding=1, bias=False)
        self.linear = nn.Linear(32*10*10, 20, bias=False)

    def forward(self, x):
        x = self.conv1(x)
        x = self.conv2(x)
        x = self.linear(x.view(x.size(0), -1))
        return x

model = Simple()
# 为了方便观察数据变化，把所有网络参数都初始化为 0.1
for m in model.parameters():
    m.data.fill_(0.1)

criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(model.parameters(), lr=1.0)

model.train()
# 模拟输入8个 sample，每个的大小是 10x10，
# 值都初始化为1，让每次输出结果都固定，方便观察
images = torch.ones(8, 3, 10, 10)
targets = torch.ones(8, dtype=torch.long)

output = model(images)
print(output.shape)
# torch.Size([8, 20])

loss = criterion(output, targets)

print(model.conv1.weight.grad)
# None
loss.backward()
print(model.conv1.weight.grad[0][0][0])
# tensor([-0.0782, -0.0842, -0.0782])
# 通过一次反向传播，计算出网络参数的导数，
# 因为篇幅原因，我们只观察一小部分结果

print(model.conv1.weight[0][0][0])
# tensor([0.1000, 0.1000, 0.1000], grad_fn=<SelectBackward>)
# 我们知道网络参数的值一开始都初始化为 0.1 的

optimizer.step()
print(model.conv1.weight[0][0][0])
# tensor([0.1782, 0.1842, 0.1782], grad_fn=<SelectBackward>)
# 回想刚才我们设置 learning rate 为 1，这样，
# 更新后的结果，正好是 (原始权重 - 求导结果) ！

optimizer.zero_grad()
print(model.conv1.weight.grad[0][0][0])
# tensor([0., 0., 0.])
# 每次更新完权重之后，我们记得要把导数清零啊，
# 不然下次会得到一个和上次计算一起累加的结果。
# 当然，zero_grad() 的位置，可以放到前边去，
# 只要保证在计算导数前，参数的导数是清零的就好。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：pytorch查看网络权重参数更新、梯度的小实例 - Python技术站

pytorch 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

KL散度理解以及使用pytorch计算KL散度

上一篇 2023年4月7日下午11:21

pytorch normal_(), fill_()

下一篇 2023年4月7日下午11:21

tensorflow

tensorflow的variable、variable_scope和get_variable的用法和区别

在tensorflow中，可以使用tf.Variable来创建一个变量，也可以使用tf.get_variable来创建一个变量，但是在一个模型需要使用其他模型的变量时，tf.get_variable就派上大用场了。先分别介绍两个函数的用法： import tensorflow as tf var1 = tf.Variable(1.0,name=’first…

2023年4月8日
000
Keras自定义评估函数

1. 比较一般的自定义函数：需要注意的是，不能像sklearn那样直接定义，因为这里的y_true和y_pred是张量，不是numpy数组。示例如下： from keras import backend def rmse(y_true, y_pred): return backend.sqrt(backend.mean(backend.square(y…

Keras 2023年4月8日
000
【caffe】卷积层代码解析

1.Forward_cpu conv_layer.cpp template <typename Dtype> void ConvolutionLayer<Dtype>::Forward_cpu(const vector<Blob<Dtype>*>& bottom, const vector<Blo…

Caffe 2023年4月7日
000
caffe tutorial

caffe official tutorial: https://caffe.berkeleyvision.org/tutorial/net_layer_blob.html blobs, Layers, and Nets: anatomy of a caffe model　　深度网络是一个由多个部件组成的模型，它能表征一系列作用于一堆数据的全连接层。这…

Caffe 2023年4月6日
000
计算pytorch标准化(Normalize)所需要数据集的均值和方差实例

在PyTorch中，我们可以使用torchvision.transforms.Normalize函数来对数据进行标准化。该函数需要输入数据集的均值和方差，以便将数据标准化为均值为0，方差为1的形式。因此，我们需要计算数据集的均值和方差，以便使用Normalize函数对数据进行标准化。以下是一个完整的攻略，包括两个示例说明。示例1：计算单通道图像数据集的均…

PyTorch 2023年5月15日
000
tensorflow

Win10+1050Ti配置Tensorflow教程

Win10+1050Ti配置Tensorflow教程笔者使用的是联想Y7000笔记本，显卡是1050Ti，在安装TensorFlow时，发现自己的显卡型号并不在NVDIA官网上支持型号的名单中，于是网上看了很多教程，很多都有问题（或者不适用于我这台电脑），踩了许多坑，总结很多之后最终配置成功，在这留下详细步骤。 NVDIA官网支持的显卡型号可以看到并没有…

2023年4月8日
000
keras创建自己训练代码

由于某个github只开源了测试代码，所以训练代码需要自己写版本keras,tensorflow # import src.modelCore as modelCore from src.modelCore import create_model from keras.optimizers import SGD from keras.preproc…

Keras 2023年4月8日
000
卷积神经网络

无多普勒频移的海底混响单元散射模型卷积法

%对混响的理解有帮助 %无多普勒频移的海底混响单元散射模型卷积法clc;clear all;close all;%参数设置============================================================fs=200000; %采样频率f0=30000; %中心频率%k=1250000; …

2023年4月6日
000

合作推广

合作推广

返回顶部