11、机器学习基础:从线性回归到多元回归

机器学习基础:从线性回归到多元回归

1. 相关性分析

在一些示例中,显著的相关性可能由以下原因导致:
- 小样本由于纯粹的偶然性容易显示出较高的相关性。
- 变量之间可能相互影响,难以确定因果关系。
- 相关变量可能受到一个或多个其他相关变量的影响。

确定因果关系导致的相关性时,领域知识或主题专家的参与非常重要。

2. 拟合斜率

我们尝试拟合一条斜率线,使每个点到该线的误差或残差尽可能小。由于误差可能为正或负,简单求和会得到零,因此我们对误差进行平方处理,然后求和,这样得到的斜率线也称为最小二乘线。

斜率方程为 (Y = mX + c),其中:
- (Y) 是给定 (X) 值的预测值。
- (m) 是 (y) 的变化量除以 (x) 的变化量,即 (x) 变量的斜率,表示 (x) 每增加一个单位时 (y) 增加的陡峭程度。
- (c) 是截距,表示线与轴的交点位置,当 (X = 0) 时,(Y) 的值为 (c)。

下面是使用 scikit-learn 库进行线性回归的代码示例:

# importing linear regression function
import sklearn.linear_model as lm
# Create linear regression object
lr = lm.LinearRegression()
x = df.Hours_Studied[:, np.newaxis]  # independent vari
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值