Pandas窗口函数(Window Function)是一种基于滑动窗口的函数,用于在序列或数据框上执行基于窗口的操作,如滚动平均、滚动求和、滚动方差等。
与一般的聚合函数不同,窗口函数可以计算滑动窗口内的值,并生成与原序列或数据框相同长度的序列或数据框。
接下来将为你介绍Pandas中常用的4种窗口函数。
滚动平均值
滚动平均值是指在滑动窗口内计算平均值。可以使用rolling()函数结合mean()函数计算滚动平均值。例如:
import pandas as pd
import numpy as np
# 创建一个Series对象
data = pd.Series(np.random.randn(1000))
# 计算滚动平均值
rolling_mean = data.rolling(window=50).mean()
# 输出结果
print(rolling_mean)
滚动标准差
滚动标准差是指在滑动窗口内计算标准差。可以使用rolling()函数结合std()函数计算滚动标准差。例如:
import pandas as pd
import numpy as np
# 创建一个Series对象
data = pd.Series(np.random.randn(1000))
# 计算滚动标准差
rolling_std = data.rolling(window=50).std()
# 输出结果
print(rolling_std)
滚动最大值和最小值
可以使用rolling()函数结合max()函数和min()函数计算滚动最大值和最小值。例如:
import pandas as pd
import numpy as np
# 创建一个Series对象
data = pd.Series(np.random.randn(1000))
# 计算滚动最大值和最小值
rolling_max = data.rolling(window=50).max()
rolling_min = data.rolling(window=50).min()
# 输出结果
print(rolling_max)
print(rolling_min)
滚动相关系数
可以使用rolling()函数结合corr()函数计算滚动相关系数。例如:
import pandas as pd
import numpy as np
# 创建两个Series对象
data1 = pd.Series(np.random.randn(1000))
data2 = pd.Series(np.random.randn(1000))
# 计算滚动相关系数
rolling_corr = data1.rolling(window=50).corr(data2.rolling(window=50))
# 输出结果
print(rolling_corr)
这里计算了两个随机序列data1和data2的滚动相关系数。
以上是一些常用的窗口函数及其示例,还有很多其他的窗口函数可以用于数据分析和处理。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Pandas最常用的4种窗口函数 - Python技术站