4、机器学习中的线性回归与逻辑回归:原理、应用与实践

机器学习中的线性回归与逻辑回归:原理、应用与实践

一、线性回归基础

1.1 帽子值与帽子矩阵

在机器学习中,线性回归是一项基础且重要的技术。对于线性模型 (Y = B_0 + B_1x + e),可以将其转换为矩阵表示形式 (Y = XB + E),其中 (Y) 保持不变,(X) 是输入值矩阵,(B) 是系数,(E) 代表误差。在回归过程中会得到一个帽子矩阵(Hat Matrix),它将模型的计算值映射到实际值,反映了特定观测值在模型中的影响力。残差平方和除以 (1) 减去帽子值等同于留一法交叉验证(LOOCV)。

1.2 定性特征的处理

定性特征(也称为因子)可以有两个或更多水平,如性别(男/女)、评价(差/中/好)等。
- 两水平特征 :对于两水平的特征,如性别,可以创建指示变量(虚拟变量),任意将一个水平赋值为 (0),另一个赋值为 (1)。例如,若将男性编码为 (0),女性编码为 (1),线性模型 (Y = B_0 + B_1x + e) 中,男性的期望为截距 (B_0),女性的期望为 (B_0 + B_1x)。
- 多水平特征 :当特征有多于两个水平时,需要创建 (n - 1) 个指示变量。例如,对于有三个水平的特征,应创建两个指示变量。若创建的指示变量数量与水平数量相同,会陷入虚拟变量陷阱,导致完全多重共线性。

下面通过一个具体例子来展示如何处理定性特征。使用 ISLR 包中的 Carseats 数据集,预测汽车座椅的销售情况,考虑定量特征 Advert

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值