pytorch之DataLoader()函数

2023年4月6日下午4:01 • PyTorch

在训练神经网络时，最好是对一个batch的数据进行操作，同时还需要对数据进行shuffle和并行加速等。对此，PyTorch提供了DataLoader帮助我们实现这些功能。

DataLoader的函数定义如下：

DataLoader(dataset, batch_size=1, shuffle=False, sampler=None, 
num_workers=0, collate_fn=default_collate, pin_memory=False, 
drop_last=False)

dataset：加载的数据集(Dataset对象)
batch_size：batch size
shuffle:：是否将数据打乱
sampler：样本抽样，后续会详细介绍
num_workers：使用多进程加载的进程数，0代表不使用多进程
collate_fn：如何将多个样本数据拼接成一个batch，一般使用默认的拼接方式即可
pin_memory：是否将数据保存在pin memory区，pin memory中的数据转到GPU会快一些
drop_last：dataset中的数据个数可能不是batch_size的整数倍，drop_last为True会将多出来不足一个batch的数据丢弃

def main():
    import visdom
    import time

    viz = visdom.Visdom()

    db = Pokemon('pokeman', 224, 'train')

    x,y = next(iter(db))   ##
    print('sample:',x.shape,y.shape,y)

    viz.image(db.denormalize(x),win='sample_x',opts=dict(title='sample_x'))

    loader = DataLoader(db,batch_size=32,shuffle=True)

    for x,y in loader:  #为了得一个一个的数据集形式的数据每一组32张
        viz.images(db.denormalize(x),nrow=8,win='batch',opts = dict(title = 'batch'))
        viz.text(str(y.numpy()),win = 'label',opts=dict(title='batch-y'))

        time.sleep(10)

在数据处理中，有时会出现某个样本无法读取等问题，比如某张图片损坏。这时在_ getitem _函数中将出现异常，此时最好的解决方案即是将出错的样本剔除

阅读剩余 18%

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：pytorch之DataLoader()函数 - Python技术站

pytorch 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

pytorch loss总结与测试

上一篇 2023年4月6日

pytorch中的select by mask

下一篇 2023年4月6日

PyTorch

python pytorch numpy DNN 线性回归模型

1、直接奉献代码，后期有入门更新，之前一直在学的是TensorFlow， import torch from torch.autograd import Variable import torch.nn.functional as F import matplotlib.pyplot as plt import numpy as np x_data = np…

2023年4月8日
000
在Keras中用Bert进行情感分析

之前在BERT实战——基于Keras一文中介绍了两个库 keras_bert 和 bert4keras 但是由于 bert4keras 处于开发阶段，有些函数名称和位置等等发生了变化，那篇文章只用了 bert4keras 进行情感分析于是这里新开了一篇文章将 2 个库都用一遍， bert4keras 也使用最新版本本文所用bert4keras时间：201…

Keras 2023年4月7日
000
Caffe

caffe 参数介绍 solver.prototxt

转载自 http://blog.csdn.net/cyh_24/article/details/51537709 net: “models/bvlc_alexnet/train_val.prototxt” test_iter: 1000 # test_interval: 1000 # base_lr: 0.01 # 开始的学习率 lr_policy: “…

2023年4月8日
000
Pytorch中Tensor与各种图像格式的相互转化详解

在PyTorch中，可以使用各种方法将Tensor与各种图像格式相互转换。以下是两个示例说明，介绍如何在PyTorch中实现Tensor与各种图像格式的相互转化。示例1：将Tensor转换为PIL图像 import torch import torchvision.transforms as transforms from PIL import Image…

PyTorch 2023年5月16日
000
用Keras搭建神经网络简单模版（二）——Classifier分类（手写数字识别）

# -*- coding: utf-8 -*- import numpy as np np.random.seed(1337) #for reproducibility再现性 from keras.datasets import mnist from keras.utils import np_utils from keras.models import S…

Keras 2023年4月8日
000
Keras 报错: Error when checking target: expected dense_4…

笔者此处是一个回归任务, 最后一层是: … pred = Dense(1)(x) 在最后一个Dense层前加上x = Flatten()(x)即可.

Keras 2023年4月8日
000
theano和keras使用过程中遇到的一些问题记录

bug信息显然是提示更新theano版本，可是一看官网最新版本就是0.7.0，使用pip更新后也提示已经是最新版本。经过检查后发现，原来theano有两个版本，一个是稳定版，通过 pip install theano获得的就是稳定版，还有一个叫做‘bleeding-edge version’,即最新版，必须通过git更新。命令如下pip install…

Keras 2023年4月6日
000
卷积神经网络

数组相关和卷积运算的实现

相性相关：设有离散信号：x(n),y(n)，其相关函数为：（4-1）上式表示的是相关运算，是两数字序列对应项相乘再相加的运算。式中m表示位移量，m>0表示y(n)序列左移，m<0表示右移，不同的m得到不同的rxy（m）值。如rxy（1），rxy（0），rxy（-1）。rxy（m）>0，表示有相同成分存在，<0表示…

2023年4月8日
000

合作推广

合作推广

返回顶部