[深度学习] Pytorch（三）—— 多/单GPU、CPU，训练保存、加载模型参数问题

2023年4月8日上午1:59 • PyTorch

上一篇实践学习中，遇到了在多/单个GPU、GPU与CPU的不同环境下训练保存、加载使用使用模型的问题，如果保存、加载的上述三类环境不同，加载时会出错。就去研究了一下，做了实验，得出以下结论：

多/单GPU训练保存模型参数、CPU加载使用模型

#保存
PATH = 'cifar_net.pth'
torch.save(net.module.state_dict(), PATH)

#加载
net = Net()
net.load_state_dict(torch.load(PATH))

多GPU训练模型、单GPU加载使用模型

#保存
PATH = 'cifar_net.pth'
torch.save(net.state_dict(), PATH)

#加载
net = Net()
net = nn.DataParallel(net)  #保存多GPU的，在加载时需要把网络也转成DataParallel的
net.to(device)  #放到GPU上
net.load_state_dict(torch.load(PATH))

# 然后测试数据也需要放到GPU上
images, labels = images.to(device), labels.to(device)

多GPU训练保存模型参数、多GPU加载使用模型

#保存
PATH = 'cifar_net.pth'
torch.save(net.state_dict(), PATH)

#加载
net = Net()
net = nn.DataParallel(net)  #保存多GPU的，在加载时需要把网络也转成DataParallel的
net.to(device)  #放到GPU上
net.load_state_dict(torch.load(PATH))

# 然后测试数据也需要放到GPU上
images, labels = images.to(device), labels.to(device)

可以看到，单GPU和多GPU加载数据的方法其实是一样的，经运行验证，只要按上述代码写，有多个GPU就调用多个，只有一个就调用一个。

另外，保存、加载网络模型有三种不同的做法

1.保存整个网络模型
2.只保存模型参数（我们用的就是这种）
3.自定义保存

详细方法，请参考：https://blog.csdn.net/Code_Mart/article/details/88254444

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：[深度学习] Pytorch（三）—— 多/单GPU、CPU，训练保存、加载模型参数问题 - Python技术站

pytorch 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

[深度学习] Pytorch学习（二）—— torch.nn 实践：训练分类器（含多GPU训练CPU加载预测的使用方法）

上一篇 2023年4月8日上午1:59

pytorch中 model.cuda的作用

下一篇 2023年4月8日

机器学习（六）：回归分析——鸢尾花多变量回归、逻辑回归三分类只用numpy，sigmoid、实现RANSAC 线性拟合

[实验1 回归分析] 一、预备知识使用梯度下降法求解多变量回归问题数据集 Iris 鸢尾花数据集是一个经典数据集，在统计学习和机器学习领域都经常被用作示例。数据集内包含 3 类共 150 条记录，每类各 50 个数据，每条记录都有 4 项特征：花萼长度、花萼宽度、花瓣长度、花瓣宽度，可以通过这4个特征预测鸢尾花卉属于（iris-setosa, iris…

机器学习 2023年4月14日
000
计算机科学家和数据科学家的区别

计算机科学家和数据科学家的区别介绍计算机科学家和数据科学家同属于计算机领域的专业人才，两者具有一些相同的技能和知识，但也存在明显的不同。本篇攻略将详细讲解两者之间的区别，并提供相关的实例说明。计算机科学家定义计算机科学家是研究计算机相关技术的专业人士，通常从事计算机系统的设计、构建、测试、优化和维护等工作。技能要求熟悉计算机硬件和软件原理，掌握…

artificial-intelligence 2023年3月27日
000
Yolov5训练意外中断后如何接续训练详解

当YOLOv5的训练意外中断时，我们可以通过接续训练来恢复训练过程，以便继续训练模型。下面是接续训练的详细步骤：首先，我们需要保存当前训练的状态。我们可以使用PyTorch提供的torch.save()函数将模型的参数和优化器的状态保存到文件中。例如，我们可以使用以下代码将模型的参数和优化器的状态保存到文件checkpoint.pth中： torch.sa…

PyTorch 2023年5月15日
000
PyTorch

pytorch神经网络解决回归问题（非常易懂）

对于pytorch的深度学习框架，在建立人工神经网络时整体的步骤主要有以下四步： 1、载入原始数据 2、构建具体神经网络 3、进行数据的训练 4、数据测试和验证 pytorch神经网络的数据载入，以MINIST书写字体的原始数据为例： import torch import matplotlib.pyplot as plt def plot_curve(d…

2023年4月8日
000
目标检测

目标定位与检测系列（14）：Libra R-CNN

论文地址：https://arxiv.org/pdf/1904.02701.pdf 摘要相比于模型框架，模型的训练过程对于检测器是否成功也同样重要。在本文工作中，我们重新研究了标准的训练过程，发现检测的性能经常受限于模型训练过程中的不平衡。这种不平衡包括以下3个层面：采样层面、特征层面和目标层面。为了缓和着中国不平嗯带来的不利影响，我们提出了一种简单有效的…

2023年4月8日
000
pytorch扩展——如何自定义前向和后向传播

版权声明：本文为博主原创文章，遵循 CC 4.0 by-sa 版权协议，转载请附上原文出处链接和本声明。本文链接： https://blog.csdn.net/u012436149/article/details/78829329 PyTorch 如何自定义 Module 定义torch.autograd.Function的子类，自己定义某些操作，…

PyTorch 2023年4月6日
000
卷积神经网络

图卷积神经网络分类的pytorch实现

　　图神经网络（GNN）目前的主流实现方式就是节点之间的信息汇聚，也就是类似于卷积网络的邻域加权和，比如图卷积网络（GCN）、图注意力网络（GAT）等。下面根据GCN的实现原理使用Pytorch张量，和调用torch_geometric包，分别对Cora数据集进行节点分类实验。　　Cora是关于科学文献之间引用关系的图结构数据集。数据集包含一个图，图中包括…

2023年4月5日
000
机器学习 1 regression

Linear regerssion 线性回归回归： stock market forecast f(过去10年股票起伏的资料) = 明天道琼指数点数 self driving car f(获取的道路图像)= 方向盘角度 recommendation f(使用者A 商品B)= 购买…

机器学习 2023年4月13日
000

合作推广

合作推广

返回顶部