线性回归与分类模型的深入解析
线性回归中的变量分析
在多元线性回归模型中,我们常常希望通过增加特征来提升模型的解释能力。以奥林匹克游泳运动员的体重预测模型为例,最初的输出结果(保留三位小数)为 (0.0 0.650 0.058 0.304) ,这表明身高是最重要的解释变量,其次是性别,然后是年龄。将其转换为标准化系数后可知,身高每增加一个标准差,平均体重将增加 0.65 个标准差。
;; 示例代码,用于计算相关系数
(defn ex-3-27 []
(let [data (->> (swimmer-data)
(i/add-derived-column "Dummy MF"
["Sex"]
dummy-mf)
(i/add-derived-column "Year of birth"
["Date of birth"]
to-year))
x (->> data
(feature-matrix ["Height, cm"
"Age"
超级会员免费看
订阅专栏 解锁全文
1671

被折叠的 条评论
为什么被折叠?



