数据分组、透视表与时间序列分析
1. 分组线性回归
在数据处理中,我们可以使用 groupby 进行更复杂的分组统计分析,只要函数返回 pandas 对象或标量值即可。例如,我们可以定义一个 regress 函数,使用 statsmodels 库对每组数据执行普通最小二乘法(OLS)回归:
import statsmodels.api as sm
def regress(data, yvar=None, xvars=None):
Y = data[yvar]
X = data[xvars]
X["intercept"] = 1.
result = sm.OLS(Y, X).fit()
return result.params
若尚未安装 statsmodels ,可以使用以下命令进行安装:
conda install statsmodels
现在,我们可以执行每年 AAPL 对 SPX 收益率的线性回归:
by_year.apply(regress, yvar="AAPL", xvars=["SPX"])
超级会员免费看
订阅专栏 解锁全文
434

被折叠的 条评论
为什么被折叠?



