用于时间序列操作的一类重要的数组转换是在滑动窗口上计算的统计数据和其他函数,或者使用指数衰减的权重进行评估。这对于平滑噪音或间隙数据非常有用。可以称这些为移动窗口函数,他们会自动排除缺失数据。
在学习之前,我们加载一些时间序列数据(stock_px.csv)并将其重新采样为工作日频率:
现在学习 rolling 操作,它的行为类似于 resample 和 groupby,可以在 Series 或 DataFrame 上与窗口一起调用(以周期数表示;创建的绘图见图 11-4):
import pandas as pd
import matplotlib.pyplot as plt
close_px_all = pd.read_csv("examples/stock_px.csv",
parse_dates=True, index_col=0)
close_px = close_px_all[["AAPL", "MSFT", "XOM"]]
close_px = close_px.resample("B").ffill()
close_px["AAPL"].plot()
close_px["AAPL"].rolling(250).mean().plot()
plt.show()
以上代码先加载了stock_px.csv中的数据,选