统计回归与分类:从线性模型到机器学习
1. 预测与描述案例引入
1.1 预测案例
- 共享单车活动预测 :通过分析相关因素来预测共享单车的使用情况,这有助于共享单车公司合理调配资源。
- 体脂预测 :依据各种身体指标预测体脂含量,在健康和健身领域有广泛应用。
- 网络广告点击预测 :确定哪些用户会点击网络广告,对广告投放策略至关重要。
1.2 描述案例
以棒球运动员为例,探讨他们是否会随着年龄增长而体重增加。这一研究不仅能揭示运动员身体特征的变化规律,还能为运动员的训练和健康管理提供科学依据。
1.3 预测与描述的区别
预测侧重于对未知结果的预估,而描述则更关注对现有数据特征和关系的阐释。以棒球运动员体重研究为例,预测可能是预估某个特定运动员未来的体重,而描述则是分析整体运动员群体体重随年龄的变化趋势。
2. 模型类型
2.1 参数模型与非参数模型
参数模型假定数据遵循特定的数学形式,如线性模型;非参数模型则不做此假设,更加灵活。例如,在预测共享单车使用情况时,参数模型可能假设使用量与天气、时间等因素呈线性关系,而非参数模型则可以捕捉到更复杂的关系。
2.2 多预测变量模型
2.2.1 多预测变量线性模型
当存在多个预测变量时,可以构建多预测变量线性模型。通过最小二乘法来估计模型系数,进而实现对目标变
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



