在Pandas中,我们可以使用fillna方法来填充缺失值,其中,可以使用平均值作为填充值。下面是具体的步骤:
1.首先,我们需要读取包含缺失值的数据集
import pandas as pd
# 读取包含缺失值的数据集
df = pd.read_csv("data.csv")
2.接着,我们需要计算出每个列的平均值
# 计算每个列的平均值
mean_values = df.mean()
3.然后,我们可以使用fillna方法,将缺失值替换为相应列的平均值
# 使用平均值填充缺失值
df.fillna(mean_values, inplace=True)
在这个例子中,我们使用了inplace=True参数,这是为了在原始数据集中填充缺失值。如果不希望改变原始数据集,可以使用以下代码:
# 使用平均值填充缺失值(不改变原始数据集)
new_df = df.fillna(mean_values)
这样,缺失值被替换成相应列的平均值,数据集中的其他值保持不变。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:如何在Pandas中用平均值填充NAN值 - Python技术站