Python3读取深度学习CIFAR-10数据集出现的若干问题解决

2023年4月17日上午3:44 • 深度学习

今天在看网上的视频学习深度学习的时候，用到了CIFAR-10数据集。当我兴高采烈的运行代码时，却发现了一些错误：

# -*- coding: utf-8 -*-
import pickle as p
import numpy as np
import os


def load_CIFAR_batch(filename):
    """ 载入cifar数据集的一个batch """
    with open(filename, 'r') as f:
        datadict = p.load(f)
        X = datadict['data']
        Y = datadict['labels']
        X = X.reshape(10000, 3, 32, 32).transpose(0, 2, 3, 1).astype("float")
        Y = np.array(Y)
        return X, Y


def load_CIFAR10(ROOT):
    """ 载入cifar全部数据 """
    xs = []
    ys = []
    for b in range(1, 6):
        f = os.path.join(ROOT, 'data_batch_%d' % (b,))
        X, Y = load_CIFAR_batch(f)
        xs.append(X)
        ys.append(Y)
    Xtr = np.concatenate(xs)
    Ytr = np.concatenate(ys)
    del X, Y
    Xte, Yte = load_CIFAR_batch(os.path.join(ROOT, 'test_batch'))
    return Xtr, Ytr, Xte, Yte

　　错误代码如下：

'gbk' codec can't decode byte 0x80 in position 0: illegal multibyte sequence

　　于是乎开始各种搜索问题，问大佬，网上的答案都是类似：

　　然而并没有解决问题！还是错误的！（我大概搜索了一下午吧，都是上面的答案）

　　哇，就当我很绝望的时候，我终于发现了一个新奇的答案，抱着试一试的态度，尝试了一下：


def load_CIFAR_batch(filename):
    """ 载入cifar数据集的一个batch """
    with open(filename, 'rb') as f:
        datadict = p.load(f, encoding='latin1')
        X = datadict['data']
        Y = datadict['labels']
        X = X.reshape(10000, 3, 32, 32).transpose(0, 2, 3, 1).astype("float")
        Y = np.array(Y)
        return X, Y

　　竟然成功了，这里没有报错了！欣喜之余，我就很好奇，encoding=’latin1’到底是啥玩意呢，以前没有见过啊？于是，我搜索了一下，了解到：

Latin1是ISO-8859-1的别名，有些环境下写作Latin-1。ISO-8859-1编码是单字节编码，向下兼容ASCII，其编码范围是0x00-0xFF，0x00-0x7F之间完全和ASCII一致，0x80-0x9F之间是控制字符，0xA0-0xFF之间是文字符号。

因为ISO-8859-1编码范围使用了单字节内的所有空间，在支持ISO-8859-1的系统中传输和存储其他任何编码的字节流都不会被抛弃。换言之，把其他任何编码的字节流当作ISO-8859-1编码看待都没有问题。这是个很重要的特性，MySQL数据库默认编码是Latin1就是利用了这个特性。ASCII编码是一个7位的容器，ISO-8859-1编码是一个8位的容器。

　　还没等我高兴起来，运行后，又发现了一个问题：

memory error

　　什么鬼？内存错误！哇，原来是数据大小的问题。

X = X.reshape(10000, 3, 32, 32).transpose(0,2,3,1).astype("float")

　　这告诉我们每批数据都是10000 * 3 * 32 * 32，相当于超过3000万个浮点数。 float数据类型实际上与float64相同，意味着每个数字大小占8个字节。这意味着每个批次占用至少240 MB。你加载6这些（5训练+ 1测试）在总产量接近1.4 GB的数据。

 for b in range(1, 2):
        f = os.path.join(ROOT, 'data_batch_%d' % (b,))
        X, Y = load_CIFAR_batch(f)
        xs.append(X)
        ys.append(Y)

　　所以如有可能，如上代码所示只能一次运行一批。

　　到此为止，错误基本搞定，下面贴出正确代码：

# -*- coding: utf-8 -*-
import pickle as p
import numpy as np
import os


def load_CIFAR_batch(filename):
    """ 载入cifar数据集的一个batch """
    with open(filename, 'rb') as f:
        datadict = p.load(f, encoding='latin1')
        X = datadict['data']
        Y = datadict['labels']
        X = X.reshape(10000, 3, 32, 32).transpose(0, 2, 3, 1).astype("float")
        Y = np.array(Y)
        return X, Y


def load_CIFAR10(ROOT):
    """ 载入cifar全部数据 """
    xs = []
    ys = []
    for b in range(1, 2):
        f = os.path.join(ROOT, 'data_batch_%d' % (b,))
        X, Y = load_CIFAR_batch(f)
        xs.append(X)         #将所有batch整合起来
        ys.append(Y)
    Xtr = np.concatenate(xs) #使变成行向量,最终Xtr的尺寸为(50000,32,32,3)
    Ytr = np.concatenate(ys)
    del X, Y
    Xte, Yte = load_CIFAR_batch(os.path.join(ROOT, 'test_batch'))
    return Xtr, Ytr, Xte, Yte

import numpy as np
from julyedu.data_utils import load_CIFAR10
import matplotlib.pyplot as plt

plt.rcParams['figure.figsize'] = (10.0, 8.0)
plt.rcParams['image.interpolation'] = 'nearest'
plt.rcParams['image.cmap'] = 'gray'

# 载入CIFAR-10数据集
cifar10_dir = 'julyedu/datasets/cifar-10-batches-py'
X_train, y_train, X_test, y_test = load_CIFAR10(cifar10_dir)

# 看看数据集中的一些样本：每个类别展示一些
print('Training data shape: ', X_train.shape)
print('Training labels shape: ', y_train.shape)
print('Test data shape: ', X_test.shape)
print('Test labels shape: ', y_test.shape)

　顺便看一下CIFAR-10数据组成：

附件：CIFAR-10 python version下载地址

CIFAR-10官网

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Python3读取深度学习CIFAR-10数据集出现的若干问题解决 - Python技术站

深度学习

0 0 打赏

微信扫一扫

支付宝扫一扫

从零开始配置深度学习环境：CUDA+Anaconda+Pytorch+TensorFlow

上一篇 2023年4月16日下午11:00

深度学习（一）之MNIST数据集分类

下一篇 2023年4月17日上午4:18

PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation

摘要点云是一种重要的几何数据结构类型。由于其不规则的格式，大多数研究人员将此类数据转化为常规的三维体素网格或图像集合。然而，这使数据变得不必要的庞大，并导致问题。在本文中，我们设计了一种新型的直接处理点云的神经网络，它很好地考虑了点在输入中的排列不变性。我们的网络名为PointNet，为从目标分类、部分分割到场景语义分析等应用提供了一个统一的架构。虽然简单…

深度学习 2023年4月11日
000
深度学习对抗生成网络使用生成对抗网络生成图片

这是最新找到的对抗生成网络的代码，亲测可以跑通。前几天也上传了一个网上找到的代码，但是这回这个代码中判别网络的假数据中加入了 detach() 函数，网上查找说这个函数可以切断神经网络的反向传导，虽然不是很理解，但总是感觉这个更对一些。对于 detach 这个函数在这里面的作用网上怎么说的都有，不过个人感觉最有说服力的说法是减少没有必要的运算，毕…

深度学习 2023年4月13日
000
深度学习框架的内存优化机制

深度学习框架的内存优化机制 https://blog.csdn.net/u014380165/article/details/77341201 这篇博文简单介绍下深度学习框架的内存优化方式，主要参考资料1，也就是MXNet的官方文档。内存优化方式主要包括：in-place operation和memory sharing两种，二者在本质上没有太大差别…

深度学习 2023年4月13日
000
【神经网络与深度学习】【计算机视觉】Faster R-CNN

Fast-RCNN基本实现端对端（除了proposal阶段外），下一步自然就是要把proposal阶段也用CNN实现（放到GPU上）。这就出现了Faster-RCNN，一个完全end-to-end的CNN对象检测模型。论文提出：网络中的各个卷积层特征（feature map）也可以用来预测类别相关的region proposal（不需要事先执行诸如sele…

深度学习 2023年4月12日
000
深度学习

深度学习在图像语义分割中的应用

本文主要分为三个部分：图像的语义分割问题是什么分割方法的概述对语义分割方面有代表性的论文的总结什么是图像的语义分割？在计算机视觉领域，分割、检测、识别、跟踪这几个问题是紧密相连的。不同于传统的基于灰度、颜色、纹理和形状等特征的图像分割问题，图像语义分割是从像素级理解图像，需要确定图像中每个像素的对应的目标类别。如下图：除了识别出摩托车和骑摩托车的人…

2023年4月10日
000
深度学习

深度学习-RNN

目录 I.前言介绍RNN的概念和应用 II. RNN基础 RNN的概念和结构 RNN的前向传播和反向传播算法前向传播算法反向传播 RNN的变种：LSTM和GRU LSTM GRU III. RNN的应用自然语言处理中的RNN应用：文本分类、情感分析、机器翻译等时间序列分析中的RNN应用：时序预测、异常检测、行为识别等 IV. RNN的进阶应用注意…

2023年4月10日
000
深度学习

深度学习教程：使用深度学习的人工智能

作为机器学习的一个重要子集，对深度学习认证的需求已经出现了巨大的增长，尤其是那些有兴趣释放人工智能无限可能性的人。深度学习教程在本文中，将带您了解以下内容，这些内容将作为后续博客的基础知识：是什么让深度学习应运而生？什么是深度学习以及它的工作原理？人工智能与深度学习的应用现在想想这个场景，你不需要做所有的工作，因为你有一台机器来为你完成它，甚至可…

2022年12月13日
000
吴恩达《深度学习》第五门课（2）自然语言处理与词嵌入

2.1词汇表征（1）使用one-hot方法表示词汇有两个主要的缺点，以10000个词为例，每个单词需要用10000维来表示，而且只有一个数是零，其他维度都是1，造成表示非常冗余，存储量大；第二每个单词表示的向量相乘都为零（正交），导致没能够表示是词汇之间的联系，比如oriange和apple,queen和king应该是联系比价紧密的，但是用上面的词典表示无…

深度学习 2023年4月11日
000

Python3读取深度学习CIFAR-10数据集出现的若干问题解决

附件：CIFAR-10 python version下载地址

相关文章