Python pandas.DataFrame 找出有空值的行

要找出pandas.DataFrame中有空值的行,可以使用以下步骤:

  1. 使用.isnull()函数来检查数据中的空值。例如,我们有一个名为df的DataFrame:
import pandas as pd

df = pd.DataFrame({'A': [1, 2, None], 'B': [5, None, 7], 'C': [9, 10, 11]})
print(df)

以下是输出:

     A    B   C
0  1.0  5.0   9
1  2.0  NaN  10
2  NaN  7.0  11

我们使用.isnull()函数来检查每个元素是否为空:

null_mask = df.isnull()
print(null_mask)

以下是输出:

       A      B      C
0  False  False  False
1  False   True  False
2   True  False  False

这个输出生成了一个新的DataFrame,其中True表示如果列中的值为空时则为该表中的空值。现在我们已经找到所有为空值的元素了。

  1. 使用.any()函数查找包含空值的行。使用了axis参数,设为1,这将提供对行的迭代:
row_has_null = null_mask.any(axis=1)
print(row_has_null)

以下是输出:

0    False
1     True
2     True
dtype: bool

这将生成一个布尔Series,其中显然包含任何空值的行返回True。

  1. 现在我们可以使用此布尔Series进行索引,以检索包含空值的行:
rows_with_null = df[row_has_null]
print(rows_with_null)

以下是输出:

     A    B   C
1  2.0  NaN  10
2  NaN  7.0  11

这将生成一个包含所有包含空值的行的DataFrame。

示例:

import pandas as pd
import numpy as np

data = {"name": ["Alice", "Bob", "Charlie", "David", "Eli"],
        "age": [25, 33, 40, None, 29],
        "gender": ["Female", None, "Male", "Male", "Male"],
        "height": [1.62, np.nan, 1.75, 1.80, 1.79]}

df = pd.DataFrame(data)
print(df)

输出:

      name   age  gender  height
0    Alice  25.0  Female    1.62
1      Bob  33.0    None     NaN
2  Charlie  40.0    Male    1.75
3    David   NaN    Male    1.80
4      Eli  29.0    Male    1.79

我们使用上述三个步骤可以找到包含空值的行:

# 第一步:使用 `.isnull()` 函数检查数据中的空值
null_mask = df.isnull()
print(null_mask)

# 第二步:使用 `.any()` 函数查找包含空值的行
row_has_null = null_mask.any(axis=1)
print(row_has_null)

# 第三步:使用此布尔Series进行索引,以检索包含空值的行
rows_with_null = df[row_has_null]
print(rows_with_null)

输出:

    name    age  gender  height
0  False  False   False   False
1  False  False    True    True
2  False  False   False   False
3  False   True   False   False
4  False  False   False   False

0    False
1     True
2    False
3     True
4    False
dtype: bool

    name   age gender  height
1    Bob  33.0   None     NaN
3  David   NaN   Male    1.80

另一个示例:

import pandas as pd
import numpy as np

data = {"name": ["Alice", "Bob", "Charlie", "David", "Eli"],
        "age": [25, 33, 40, None, 29],
        "gender": ["Female", None, "Male", "Male", "Male"],
        "height": [1.62, np.nan, 1.75, 1.80, 1.79],
        "nationality": ["USA","China",None,"UK","India"]}

df = pd.DataFrame(data)
print(df)

输出:

      name   age  gender  height nationality
0    Alice  25.0  Female    1.62         USA
1      Bob  33.0    None     NaN       China
2  Charlie  40.0    Male    1.75        None
3    David   NaN    Male    1.80          UK
4      Eli  29.0    Male    1.79       India

现在假设我们想找到包含空值的行,但只想检查age和gender列中的空值,我们可以这样做:

# 第一步:使用 `.isnull()` 函数检查数据中的空值
null_mask = df[['age', 'gender']].isnull()
print(null_mask)

# 第二步:使用 `.any()` 函数查找包含空值的行
row_has_null = null_mask.any(axis=1)
print(row_has_null)

# 第三步:使用此布尔Series进行索引,以检索包含空值的行
rows_with_null = df[row_has_null]
print(rows_with_null)

这里我们指定使用age和gender列,然后执行相同的步骤,并使用此新创建的DataFrame执行第二步。输出为:

    age  gender
0  False   False
1  False    True
2  False   False
3   True   False
4  False   False

0    False
1     True
2    False
3     True
4    False
dtype: bool

    name   age gender  height nationality
1    Bob  33.0   None     NaN       China
3  David   NaN   Male     1.8          UK

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python pandas.DataFrame 找出有空值的行 - Python技术站

(0)
上一篇 2023年6月13日
下一篇 2023年6月13日

相关文章

  • Python pandas.DataFrame调整列顺序及修改index名的方法

    下面是关于“Pythonpandas.DataFrame调整列顺序及修改index名的方法”的完整攻略。 1. 调整列顺序 在 Pandas 中,可以使用 DataFrame 对象的 loc 或 iloc 属性来调整列顺序。其中,loc 使用列名定位列,而 iloc 则使用列索引定位列。 下面是使用 loc 和 iloc 来调整列顺序的示例: import …

    python 2023年5月14日
    00
  • 详细介绍pandas的DataFrame的append方法使用

    当我们在使用 pandas 来处理数据时,DataFrame 是我们使用最频繁的数据结构之一。DataFrame 中的数据以二维表格的形式出现,其中每行代表一个数据样本,每列代表一个特征或变量。 在 pandas 的 DataFrame 中,我们可以使用 append 方法来合并两个 DataFrame。这个方法返回的是一个新的 DataFrame,原始的两…

    python 2023年5月14日
    00
  • Python实现平行坐标图的绘制(plotly)方式

    平行坐标图是一种常用的多维数据可视化方式,可以用于快速发现有趣的数据模式以及数据的异常值。Python中有许多可用于绘制平行坐标图的工具,其中一种较为流行且易于上手的工具是plotly。下面是一个完整的攻略,用于指导读者如何使用Python的plotly库绘制平行坐标图。 第一步:导入库 在本攻略中,我们将使用Python的plotly库来绘制平行坐标图。在…

    python 2023年6月13日
    00
  • 将pymysql获取到的数据类型是tuple转化为pandas方式

    将pymysql获取到的数据类型是tuple转化为pandas方式需要经过以下步骤: 步骤一:导入相关的python模块 使用Pandas库需要首先导入相关的python模块,其中必须导入pandas和pymysql模块。在python文件开头,可以这样编写导入语句: import pandas as pd import pymysql 步骤二:连接MySQ…

    python 2023年6月13日
    00
  • 计算Pandas数据框架的列数

    计算Pandas数据框架的列数可以通过shape属性来实现。shape属性返回一个元组,元组的第一个值为数据框架的行数,第二个值为数据框架的列数。 具体步骤如下: 导入pandas库并读取数据,生成一个数据框架对象。 import pandas as pd df = pd.read_csv(‘data.csv’) 调用shape属性,并打印结果。 print…

    python-answer 2023年3月27日
    00
  • Pandas查询数据df.query的使用

    下面是Pandas查询数据df.query的完整攻略: 什么是df.query? Pandas中的数据框(DataFrames)可以使用query函数从数据结构中查询子集。query 函数使用字符串表达式来查询数据框中的行。使用此函数可以通过快速应用自然语言查询语句来过滤数据,这使得文本搜索变得容易。 df.query语法 使用df.query()函数可以接…

    python 2023年5月14日
    00
  • Pandas读取csv的实现

    下面是关于“Pandas读取csv的实现”的完整攻略: 什么是Pandas Pandas是一个数据分析库,提供了许多用于数据处理和分析的函数和工具,它可以读写各种格式的数据,其中包括csv格式的数据。通过Pandas库,我们可以很方便地读取csv格式的数据并对其进行处理和分析。 Pandas如何读取csv Pandas提供了读取csv文件的函数 read_c…

    python 2023年5月14日
    00
  • 在Python Pandas中改变数字大小

    下面是在Python Pandas中改变数字大小的完整攻略,包含以下内容: 1.使用apply()方法改变数字大小2.使用map()方法改变数字大小3.使用lambda表达式改变数字大小4.使用astype()方法改变数据类型 1.使用apply()方法改变数字大小apply()方法可以对一个数据框中的某一列或多列数据进行操作,比如,当我们需要改变某一列数据…

    python-answer 2023年3月27日
    00
合作推广
合作推广
分享本页
返回顶部