pytorch optimizer小记

2023年4月6日下午4:00 • PyTorch

yizhihongxing

1.最简单情况：

optimizer = SGD(net.parameters(), lr=0.1, weight_decay=0.05, momentum=0.9)

　　查看一下optimizer参数具体情况：print(len(opt.param_groups))

会发现长度只有1，是一个只有一个元素的数组，因此，查看一下这个数组第一个元素的情况：

for i in opt.param_groups[0].keys():
    print(i)

　　会显示：

params
lr
momentum
dampening
weight_decay
nesterov

　　这就是opt.param_groups[0]中参数，以键值对的形式存放的，若要更改学习率，可以直接：

opt.param_groups[0]['lr'] = 给定新值

　　2.既然opt.param_groups列表的长度只有1，那为什么还要用列表的形式存放呢？那是因为列表的长度可以不止1：

opt = optim.Adam([{'params':model1.parameters(),'lr':0.01},
                        {'params':model2.parameters(),'lr':0.1},
                        ])

　　一个优化器可以同时优化多个网络参数，如上所示，此时opt.param_groups列表的长度为2

3.同理，可以对同一个网络的不同层分别以不同学习率来优化

optimizer = optim.Adam([{'params':model.conv1.parameters(),'lr':0.2},
                        {'params':model.conv2.parameters(),'lr':0.2},
                        {'params':prelu_params,'lr':0.02},
                        {'params':rest_params,'lr':0.3}
                        ])

　　

4.训练时还可以固定某些层不训练（参考：https://blog.csdn.net/qq_34914551/article/details/87699317）：

model = Net()
for name, p in model.named_parameters():
    if name.startswith('conv1'):
        p.requires_grad = False
 
import torch.optim as optim
optimizer = optim.Adam(filter(lambda x: x.requires_grad is not False ,model.parameters()),lr= 0.2)

　　

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：pytorch optimizer小记 - Python技术站

pytorch 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

pytorch中动态调整学习率

上一篇 2023年4月6日

pytorch扩展——如何自定义前向和后向传播

下一篇 2023年4月6日

目标检测

【目标检测】：SPP-Net深入理解（从R-CNN到SPP-Net）

一. 导论 SPP-Net是何凯明在基于R-CNN的基础上提出来的目标检测模型，使用SPP-Net可以大幅度提升目标检测的速度，检测同样一张图片当中的所有目标，SPP-Net所花费的时间仅仅是RCNN的百分之一，而且检测的准确率甚至会更高。那么SPP-Net是怎么设计的呢？我们要想理解SPP-Net，先来回顾一下RCNN当中的知识吧。下图为SPP-Net的结…

2023年4月6日
000
目标检测

目标检测之SSD

一、目标检测之SSD SSD: Single Shot MultiBox Detector 论文链接：https://arxiv.org/abs/1512.02325 论文翻译：https://blog.csdn.net/denghecsdn/article/details/77429978 论文详解：https://blog.csdn.net/WZZ1…

2023年4月8日
000
[机器学习]-Adaboost提升算法从原理到实践

转发 from http://www.cnblogs.com/NextNight/p/6227526.html 1.基本思想：综合某些专家的判断，往往要比一个专家单独的判断要好。在”强可学习”和”弱可学习”的概念上来说就是我们通过对多个弱可学习的算法进行”组合提升或者说是强化”得到一个性能赶超强可学习算法的算法。如何地这些弱算法进行提升是关键！AdaBo…

机器学习 2023年4月13日
000
分享Pytorch获取中间层输出的3种方法

分享PyTorch获取中间层输出的3种方法在PyTorch中，我们可以使用多种方法来获取神经网络模型中间层的输出。本文将介绍三种常用的方法，并提供示例说明。 1. 使用register_forward_hook()方法 register_forward_hook()方法是一种常用的方法，用于在神经网络模型的前向传递过程中获取中间层的输出。以下是一个示例，展…

PyTorch 2023年5月15日
000
机器学习之路–seaborn

seaborn是基于plt的封装好的库。有很强的作图功能。 1、布局风格设置（图形的style）and 细节设置用matplotlib作图： import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt x = np.linspace(0, 14, 100) for …

机器学习 2023年4月13日
000
深度学习_1_Tensorflow_2_数据_文件读取

队列和线程文件读取, 图片处理问题:大文件读取,读取速度, 在tensorflow中真正的多线程子线程读取数据向队列放数据(如每次100个),主线程学习,不用全部数据读取后,开始学习队列与对垒管理器,线程与协调器 dequeue() 出队方法 enqueue(vals,name=None) 入队方法 enqueue_many(vals,name=N…

tensorflow 2023年4月6日
000
tensorflow

《转》tensorflow学习笔记

from http://m.blog.csdn.net/shengshengwang/article/details/75235860 1. RNN结构解析：（1）one to one表示单输入单输出网络。这里的但输入并非表示网络的输入向量长度为1，而是指数据的长度是确定的。比如输入数据可以是一个固定类型的数，可以是一个固定长度的向量，或是一个固定大小…

2023年4月8日
000
tensorflow

TensorFlow 深度学习笔记 Logistic Classification

Github工程地址：https://github.com/ahangchen/GDLnotes 欢迎star，有问题可以到Issue区讨论官方教程地址视频/字幕下载 About simple but important classifier Train your first simple model entirely end to end 下载、预处理…

2023年4月8日
000

合作推广

合作推广

返回顶部