36、机器学习基础:回归、聚类与深度学习入门

机器学习基础:回归、聚类与深度学习入门

1. 回归问题概述

在经典的回归问题中,我们可以设想这样一个场景:银行经理能否根据客户的工资预测其储蓄,从而为客户提供定制化的银行规划?为了回答这个问题,我们可以构建一个简单的回归模型,其形式为:$y = α + β * x$,其中 $y$ 是待预测的变量(收入),$x$ 是预测因子(工资),$β$ 是斜率,$α$ 是截距(在机器学习术语中通常称为偏差)。

如果要从 $x$ 预测 $y$,我们可以收集许多点 $(x, y)$,然后尝试确定 $α$ 和 $β$ 的值(它们通常统称为系数),以使这些点得到最优拟合。一旦得到这些系数,就可以使用上述公式为任何 $x$ 值计算 $y$ 的估计值 $\hat{y}$。

然而,这个例子相当简单,实际上,准确预测收入可能不仅取决于工资,还受到许多其他因素的影响,如年龄、抵押贷款等。与分类问题类似,更多的输入特征可以帮助我们做出更明智的决策。实际上,基于多个特征的回归也是可行的,此时方程扩展为:$y = α + \sum β_i * x_i$。在这个公式中,每个 $β_i$ 代表特征 $x_i$ 对预测的“权重”(正或负)。

2. 回归算法

2.1 简单线性回归

本节开头给出的方程代表了回归的最基本形式,即简单线性回归。这里的“线性”意味着模型表示为各项的“加权”和。这些项可以是特征本身,也可以是对特征进行函数运算的结果。例如,对于某些实例分布,曲线可能比直线更适合拟合。当我们对特征使用幂、乘法或三角函数等运算时,就是在定义基函数。通过使用这些非线性函数,我们可以寻找其他(通常更好的)“拟合”方式,但得到的模型仍然是线性的。

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值