Python 回归分析实战指南
1. 简单线性回归分析
在进行回归分析时,使用 statsmodels 公式 API 可以创建模型。以简单线性回归为例,通过调用模型对象的 .fit() 方法,使用普通最小二乘法来估计回归系数(参数),从而将线性回归模型拟合到数据上。
.fit 方法提供了许多用于探索其输出的函数,如 conf_int() 、 pvalues 、 tvalues 和 summary() 等。通过这些函数,可以从结果中获取模型的参数、置信区间、p 值和 t 值等信息。其中, summary() 函数最为实用,它会呈现一个包含所有相关分析结果的表格。
以一个具体的简单线性回归分析结果为例(图 2.15),在该结果中,左上角显示了模型中的因变量( Dep. Variable ),在练习 2.04 中该因变量为 crimeRatePerCapita 。同时,还给出了一个名为 R - squared 的统计量,其值为 0.144,换算成百分比为 14.4%。R - squared 统计量衡量了模型能够解释因变量( crimeRatePerCapita )变异性的程度,可看作是衡量模型对数据集拟合程度的指标。
在图 2.15 的第二部分,报告了模型中的截距和自变量。这里的自变量是自住房屋的中位价值( medianValu
超级会员免费看
订阅专栏 解锁全文
1460

被折叠的 条评论
为什么被折叠?



