pytorch Dataset数据集和Dataloader迭代数据集

2023年4月8日上午10:09 • PyTorch

import torch
from torch.utils.data import Dataset,DataLoader

class SmsDataset(Dataset):

    def __init__(self):
        self.file_path = "./SMSSpamCollection"
        self.lines = open(self.file_path,encoding="utf-8").readlines()

    def __getitem__(self, index):
        line = self.lines[index].strip()
        label = line.split("\t")[0]
        sent = line.split("\t")[1]
        return label,sent

    def __len__(self):
        return len(self.lines)

sms_dataset = SmsDataset()
dataloader = DataLoader(sms_dataset,batch_size=2,shuffle=True)


if __name__ == '__main__':
    for idx,(label,sent) in enumerate(dataloader):
        print(idx)
        print(label)
        print(sent)
        break
    print(len(sms_dataset))
    print(len(dataloader))

　　

0
('ham', 'spam')
('And popping <#> ibuprofens was no help.', 'This is the 2nd time we have tried 2 contact u. U have won the 750 Pound prize. 2 claim is easy, call 08712101358 NOW! Only 10p per min. BT-national-rate')
5574
2787

　　

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：pytorch Dataset数据集和Dataloader迭代数据集 - Python技术站

pytorch 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

pytorch torchversion自带的数据集

上一篇 2023年4月8日上午10:09

pytorch 手写数字识别项目增量式训练

下一篇 2023年4月8日

Caffe

SSD-caffe 实验

参考博客：https://blog.csdn.net/samylee/article/details/51822832 将kitti_detec数据转化成VOC格式：比例为8:1：1(原始训练集) 它由7481个训练图像（有标签）和7518个测试图像（无标签）组成。该基准使用二D边界框重叠来计算用于检测的精确召回曲线，并计算定位相似性以评估鸟瞰视图中的定位…

2023年4月8日
000
pytorch与torchvision版本、tensorflow与keras版本

pytorch==1.1.0 torchvision==0.3.0 pytorch==1.0.0 torchvision==0.2.1来源：https://pytorch.org/get-started/previous-versions/tensorflow2.1 keras2.3.1 python3.6来源：https://docs.floydhub.c…

Keras 2023年4月6日
000
Caffe

fcn+caffe+制作自己的数据集

参考博客： http://blog.csdn.net/jacke121/article/details/78160398 以视网膜血管分割的数据集为例：训练样本：训练标签：标签图的制作依据voc数据集中的样例，将被检测的目标改为voc中的一类。将用ps软件制作的黑底白色标签转化为，目标为(128,0,0)的单通道彩色图片，存储格式为.png。也就…

2023年4月5日
000
《机器学习基石》—感知机算法

基本思想是，把特征的线性加权值作为一个分数，根据这个分数与一个门限值的关系来进行分类：我们加一个特征x0等于1，门限值就可以放到w里面去，得到更简单的形式：这就是感知机模型，对应一个分离超平面。 2 如何来学习感知机 “知错能改”原则：找到一个误分类点，就尝试去修正它。具体的修正过程如下：当找到一个误分类点时，如果y本来是+1，则说明现在的w与x的…

机器学习 2023年4月12日
000
Use Slim to overview model in Tensorflow like model.summary() in Keras

model.summary() in Tensorflow like Keras Use Slim Example: import numpy as np from tensorflow.python.layers import base import tensorflow as tf import tensorflow.contrib.slim as sl…

Keras 2023年4月8日
000
循环神经网络

tensorflow实现循环神经网络

tensorflow实现循环神经网络包括卷积神经网络(CNN)在内的各种前馈神经网络模型, 其一次前馈过程的输出只与当前输入有关与历史输入无关. 递归神经网络(Recurrent Neural Network, RNN)充分挖掘了序列数据中的信息, 在时间序列和自然语言处理方面有着重要的应用. 递归神经网络可以展开为普通的前馈神经网络: 长短期记忆模型(L…

2023年4月6日
000
卷积神经网络

卷积神经网络_(3)_几种简单训练技巧

下面来介绍几种简单的训练技巧： 1.首先说一下filter(感受野)的概念：感受野的大小即特征图中的某一单元是从原始输入图像中多大的一块区域中提取的特征；如上图，第一次卷积后得到的特征图中，每一个小单元的感受野大小为3*3，而第二次卷积后特征图中的每一个小单元对应的感受野大小为5*5，以此类推，如果用三层3*3的filter，那么最后一层特征图中每一个小…

2023年4月8日
000
目标检测

Object Detection(目标检测神文)

转 2018年08月21日 14:25:28 Mars_WH 阅读数 23382 标签： object detect faster R-CNN SSD YOLO MTCNN 更多个人分类：目标检测 https://handong1587.github.io/deep_learning/2015/10/09/object-detection.html，如有…

2023年4月8日
000

合作推广

合作推广

返回顶部