机器学习基本概念(3)--线性模型概述

这篇博客详细介绍了线性模型,包括基本形式、线性回归(多元、对数和广义线性模型)、对数几率回归、线性判别分析以及多分类学习策略。此外,还讨论了类别不平衡问题的处理方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

线性模型

基本形式

模型可以用线性方程式来表达,确定每个属性值前面的系数和最后的常熟模型就可以确定。

         线性模型形式简单,易于建模,但是很多功能强大的非线性模型可以通过引入层级结构或者高维映射而得到。因此线模型有很好的可解释性或者说是可理解性。

线性回归

给定义一个数据集D,线性回归做的是找一条直线使得通过这个模型,能够比较正确的预测。

         若属性值存在“序”的关系,则通过连续化将其转化为连续值,若不存在,则可以转化为K维向量。

Eg:书中的例子:瓜的种类有西瓜、南瓜、黄瓜可以转化为(0.0.1)、(0.1.0)、(1.0.0)。

 

线性回归试图学得

         f(xi) = w*xi + b, 使得 f(xi)接近yi

 

均方误差:所有f(xi)– y i的平方;

因此以上问题就可以转化为使得均方误差最小即可。基于此的称为“最小二乘法”,最小二乘法可以求得。求解wb使线性模型均方误差最小的过程,称为线性回归模型的最小二乘参数估计parameterestimation

多元线性回归

当样本有多个属性来描述他们时候,

f(xi) = wt *xi + b , 使得 f(xi)接近yi           ----------此处的 w x 是集合。

称为多元线性回归。

 

多元线性回归涉及向量和矩阵的运算。如果属性过多,甚至超过样例的数量,那么就导致矩阵的列数多于行数,就可以解出多个w,选择哪一个解由学习算法的归纳偏好决定。

对数线性回归

         在以上的研究过程中,我们不仅可以使得真实值符合线性回归,我们也可以使得真实值的衍生值符合线性回归即可,例如使得lny符合线性回归,这就是对数线性回归。

         虽然这种形式上任然是线性回归,但是其实是在求取输入空间到非线性区间的映射。

 

广义线性模型

更一般的我们考虑单调可微的函数g(.)

         g(.) * Y = = wt *xi

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值