scikit-learn报”ValueError: Input contains NaN, infinity or a value too large for dtype(‘float64’). “的原因以及解决办法

2023年3月19日下午1:41 • python-answer

yizhihongxing

问题原因

该报错常常是由于数据存在缺失值 (NaN) 或者数据超出了 float64 数据类型的范围 (如出现了过大或过小的值) 导致的。scikit-learn 中很多算法都要求输入的数据不含缺失值，因此需要对缺失值进行处理。

解决方法

检查数据中是否存在缺失值 (NaN)。

可以使用 pandas 库中的 .isnull() 或 .notnull() 函数：

import pandas as pd

data = pd.read_csv("data.csv")
print(data.isnull().sum()) # 统计每一列的缺失值数量

如果输出结果中存在不为 0 的数，则说明数据中存在缺失值。可以考虑删除含有缺失值的行或者使用合适的填充方法来处理缺失值。

对可能会导致数据溢出的数据进行预处理，去除过大或过小的值。

可以使用 numpy 库中的 .seterr() 函数：

import numpy as np

np.seterr(all='ignore') # 忽略所有错误

或者使用数据的上下界进行截断缩放：

from sklearn.preprocessing import MinMaxScaler

scaler = MinMaxScaler(feature_range=(0, 1)) # 设置数据范围为0-1
scaled_data = scaler.fit_transform(data) # 对数据进行缩放

对发生错误的数据直接进行删除处理。

删除缺失值、nan、inf 或 large 的行：

import numpy as np

data = data[~np.isnan(data).any(axis=1)] # 删除含有 nan 的行
data = data[~np.isinf(data).any(axis=1)] # 删除含有 inf 的行
data = data[np.abs(data) < large].reshape(-1,1) # 删除过大或过小的行

使用 KNN 或者均值、中位数等方法进行填充。

使用 impute 模块中的 SimpleImputer() 函数来填充缺失值：

from sklearn.impute import SimpleImputer

filler = SimpleImputer(strategy="mean") # 求出每列的平均值，并使用其进行填充
data = filler.fit_transform(data)

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：scikit-learn报”ValueError: Input contains NaN, infinity or a value too large for dtype(‘float64’). “的原因以及解决办法 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

scikit-learn报”ValueError: Target is multiclass but average=’binary’. Please choose another average setting, one of [None, ‘micro’, ‘macro’, ‘weighted’]. “的原因以及解决办法

上一篇 2023年3月19日

scikit-learn报”ValueError: When using ‘sparse’, the data must be in CSR format. Got {input_format}. “的原因以及解决办法

下一篇 2023年3月19日

Python报”TypeError: ‘module’ object is not callable “的原因以及解决办法

Python中的"TypeError: ‘module’ object is not callable"错误通常是由于在代码中使用了某个模块或库的名称作为函数名或方法名，从而发生了命名冲突。例如，如果我们写了这样的代码： import math def math(x): return x**2 print(math(5)) 当我们运行此…

python-answer 2023年3月15日
000
Django报”InvalidBlockTag “的原因以及解决办法

Django是一种流行的Web框架，它允许开发人员使用Python语言构建强大的Web应用程序。但是，有时候在使用Django时，可能会遇到"InvalidBlockTag "错误，导致应用程序无法正常工作。在本文中，我们将深入了解这个问题的原因以及如何解决它。错误原因首先，我们需要了解"InvalidBlockTag &q…

python-answer 2023年3月14日
000
PyTorch报”AttributeError: module ‘torch’ has no attribute ‘set_grad_enabled’ “的原因以及解决办法

如果在使用 PyTorch 的过程中出现了类似 "AttributeError: module ‘torch’ has no attribute ‘set_grad_enabled’" 的错误，这通常是由于 PyTorch 版本不匹配或者安装出现问题导致的。下面我们提供一些解决办法：更新PyTorch版本在使用 PyTorch 的过程…

python-answer 2023年3月19日
000
PySpider报”RuntimeWarning “异常的原因以及解决办法

PySpider是一个非常强大的Python爬虫框架，但在使用中可能会出现一些异常情况。其中一个常见的异常是"RuntimeWarning "，这个异常通常会在爬虫运行时出现。本文将详细讲解PySpider报"RuntimeWarning "异常的原因以及解决办法的完整攻略。异常原因当PySpider爬虫程序处理…

python-answer 2023年3月20日
000
scikit-learn报”ValueError: Estimator fit failed. The score on this train-test partition for these parameters will be set to nan. Details: {details} “的原因以及解决办法

在使用scikit-learn进行机器学习模型训练时，可能会遇到"ValueError: Estimator fit failed. The score on this train-test partition for these parameters will be set to nan. Details: {details} "的报错…

python-answer 2023年3月19日
001
详解TensorFlow报”AbortedError: Error reported to Coordinator: “的原因以及解决办法

"AbortedError: Error reported to Coordinator"是Tensorflow中常见的报错之一，它的原因可能非常多样化，通常是由于Tensorflow运行时遇到了某些内部错误而引起的。下面列举了可能引起"AbortedError: Error reported to Coordinator&q…

python-answer 2023年3月19日
000
Pandas报”ValueError:Lengths must match to compare“的原因以及解决办法

在 Pandas 中，有时候会遇到”ValueError:Lengths must match to compare”这个错误。这个错误产生的原因是因为在某个操作过程中，需要比较的两个对象的长度不匹配，从而导致报错。本文将详细介绍这个错误的原因以及如何解决它。错误示例 import pandas as pd df1 = pd.DataFrame({&#03…

python-answer 2023年3月14日
001
详解TensorFlow报”UnimplementedError: RandomCrop is only supported on CPU “的原因以及解决办法

问题描述当你试图在 TensorFlow 模型中使用 RandomCrop 函数时，你可能会遇到以下错误： UnimplementedError: RandomCrop is only supported on CPU. 其实，这个错误是由于 RandomCrop 函数只支持 CPU 的缘故。解决办法如果你的模型需要使用 RandomCrop 函数，那…

python-answer 2023年3月18日
000

合作推广

合作推广

返回顶部