【问题标题】:Fill in missing column values based on pattern in Python根据Python中的模式填充缺失的列值
【发布时间】:2023-04-01 10:44:01
【问题描述】:

我有一个数据框 df,我想在其中根据季度填充特定列中的缺失值。

数据

type    date    stat  test
aa      Q1 2022 20    1
aa      Q2 2022 10    2
aa      Q3 2022 30    1
bb      Q1 2022 30    1
bb      Q2 2022 10    1

希望

type    date    stat  test
aa      Q1 2022 20    1
aa      Q2 2022 10    2
aa      Q3 2022 30    1
aa      Q4 2022 0
bb      Q1 2022 30    1
bb      Q2 2022 10    1
bb      Q3 2022 0
bb      Q4 2022 0

正在做

Logic:

The pattern is Q1 2022, Q2 2022, Q3 2022 and Q4 2022. 
If there is a 'break' in this pattern, the missing data should fill in accordingly with a stat 
value of 0.

我相信我可以创建一个字典,然后结合 impute 函数

data = {  "Q1 2022":0 ,
          "Q2 2022":0 ,
          "Q3 2022":0 ,
          "Q4 2022":0 ,
       }



df["type"].fillna("", inplace = True) 
df["date"].fillna("", inplace = True)   #input dictionary mapping
df["stat"].fillna("0", inplace = True)

欢迎提出任何建议。

【问题讨论】:

  • 我想你可以使用 pd.to_datetimeresample 的组合。
  • 啊好的,我试试这个谢谢

标签:
python
pandas
numpy