详解pandas.fillna()(填充缺失值)函数使用方法

pandas.fillna() 用于对缺失值进行填充,可以将缺失值替换为指定的数值或使用指定的填充规则进行填充。该函数的语法格式如下:

DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)

其中各参数的含义如下:

  • value:用于填充缺失值的值,可以是标量、字典、Series 或 DataFrame。
  • method:填充缺失值的方法,可选值包括 backfill(向前填充)、bfill(向后填充)、pad(用前面的非缺失数据填充)、ffill(用后面的非缺失数据填充)等。
  • axis:指定在哪个轴上执行填充操作。
  • inplace:是否在原 DataFrame 上直接进行修改。
  • limit:对于前向填充和后向填充,限制填充缺失值的最大数量。
  • downcast:指定填充后的数据类型,可选值包括infer(自动推断)、integer(整型)等。

下面通过两个实例来说明 pandas.fillna() 的用法:

示例1:用指定值填充缺失值

import pandas as pd
import numpy as np

# 创建一个包含缺失值的 DataFrame
df = pd.DataFrame({'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, np.nan], 'C': [8, 9, 10, 11]})
print(df)

# 用指定值(0)填充缺失值
df.fillna(0, inplace=True)
print(df)

输出结果为:

     A    B   C
0  1.0  5.0   8
1  2.0  NaN   9
2  NaN  7.0  10
3  4.0  NaN  11

     A    B   C
0  1.0  5.0   8
1  2.0  0.0   9
2  0.0  7.0  10
3  4.0  0.0  11

从输出结果可以看出,在第一次打印 DataFrame 时,存在三个缺失值。在第二次打印 DataFrame 时,使用 fillna() 函数用指定值 0 来代替所有的缺失值。

示例2:使用指定的填充规则填充缺失值

import pandas as pd
import numpy as np

# 创建一个包含缺失值的 DataFrame
df = pd.DataFrame({'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, np.nan], 'C': [8, 9, 10, 11]})
print(df)

# 用向后填充的方式填充缺失值
df.fillna(method='bfill', inplace=True)
print(df)

输出结果为:

     A    B   C
0  1.0  5.0   8
1  2.0  NaN   9
2  NaN  7.0  10
3  4.0  NaN  11

     A    B   C
0  1.0  5.0   8
1  2.0  7.0   9
2  4.0  7.0  10
3  4.0  NaN  11

从输出结果可以看出,在第一次打印 DataFrame 时,存在三个缺失值。在第二次打印 DataFrame 时,使用了 method='bfill' 参数,即用向后填充的方式来填充缺失值。最终,缺失值被填充为前面的值,例如第二行第二列的缺失值被填充为 5 后面的的 7。由于最后一行没有缺失值可以进行填充,因此最后一行的缺失值仍然保持不变。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:详解pandas.fillna()(填充缺失值)函数使用方法 - Python技术站

(3)
上一篇 2023年3月22日
下一篇 2023年3月22日

相关文章

  • 详解pandas.DataFrame.drop()(删除行或列)函数使用方法

    pandas.DataFrame.drop函数是一种用于从数据框中删除给定坐标轴上的行或列的方法。它可以用于删除指定标签的行或列,并返回新的数据框。 语法格式 在Python中,可以使用以下语法来使用DataFrame.drop()函数: DataFrame.drop(labels=None, axis=0, index=None, columns=None…

    Pandas函数大全 2023年3月22日
    00
  • 详解pandas.map()(映射数值)函数使用方法

    pandas.map()函数的作用是对Series对象中的每一个元素都应用一个函数,并返回一个新的Series对象,其中新的Series对象的元素是原Series对象元素经过函数处理的结果。 使用方法: pandas.map(function, na_action=None) 参数说明: function:函数类型,对每个元素应用的函数。 na_action…

    Pandas函数大全 2023年3月22日
    00
  • 详解pandas.Series.apply()(应用函数到序列)函数使用方法

    pandas.Series.apply()是一个数据帧操作函数,该函数可以应用于Series中每一个元素。它的目的是将一个函数作用于Series的每一个元素上,并返回一个新的Series。 使用方法: pandas.Series.apply(func, convert_dtype=True, args=(), **kwds) 参数说明: func: 一个可以…

    Pandas函数大全 2023年3月22日
    00
  • 详解pandas.drop_duplicates()(删除重复值)函数使用方法

    pandas.drop_duplicates()的作用 pandas.drop_duplicates()是pandas库中的一个函数,主要用于去除数据集中的重复行。这个函数可以从任何一个DataFrame或Series对象中删除具有重复值的行,并返回一个新的DataFrame或Series,其中不包含任何重复的值。 pandas.drop_duplicate…

    Pandas函数大全 2023年3月22日
    00
  • 详解pandas.pivot_table()(创建透视表)函数使用方法

    作用 pandas.pivot_table()是pandas库中的一个函数,它可以根据指定的行和列,对数据进行透视,计算出指定字段的聚合值,并返回一个新的表格。pivot_table()可以帮助我们进行数据的汇总和分析,方便我们发现数据中的规律和趋势。 使用方法 pivot_table()函数的语法格式如下: pivot_table(data, values…

    Pandas函数大全 2023年3月22日
    00
  • 详解pandas.DataFrame.isnull()(检测缺失值)函数使用方法

    pandas.DataFrame.isnull() 函数用于检查 DataFrame 中的数据是否为空(NaN)值,返回一个布尔型(True或False)的 DataFrame,其中True表示该位置为空,False表示该位置不为空。 使用方法 首先,导入 pandas 包并创建一个 DataFrame 示例: import pandas as pd dat…

    Pandas函数大全 2023年3月22日
    00
  • 详解pandas.DataFrame.to_csv()(将数据框写入CSV文件)函数使用方法

    pandas.DataFrame.to_csv() 是 pandas 库中 DataFrame 类的一个方法,用于将 DataFrame 数据写入到一个 CSV 文件中。其作用是将 DataFrame 数组保存到 CSV 文件中,以供后续使用。下面是 to_csv() 的使用方法的详细攻略。 语法 DataFrame.to_csv(self, path_or…

    Pandas函数大全 2023年3月22日
    00
  • 详解pandas.map()(映射数值)函数使用方法

    pandas.map()函数是对Series中的每个元素执行相同的映射/转换操作的方法,其主要作用是对Series中的每个元素进行映射转换,返回一个新的Series对象。 pandas.map()函数的语法如下: DataFrame.map(arg, na_action=None) 其中,参数arg可以是一个函数、字典或Series,用来指定转换方法。na_…

    Pandas函数大全 2023年3月22日
    00
合作推广
合作推广
分享本页
返回顶部