机器学习-03 线性模型

最新推荐文章于 2024-07-22 16:16:12 发布

SUNNY小飞

最新推荐文章于 2024-07-22 16:16:12 发布

阅读量1.7k

点赞数 4

分类专栏：机器学习文章标签：机器学习机器学习基础线性模型

本文链接：https://blog.youkuaiyun.com/qq_34290470/article/details/109391714

版权

本文详细介绍了线性模型在机器学习中的应用，包括线性回归、线性几率回归、线性判别分析、多分类学习以及如何处理类别不平衡问题。线性回归通过最小二乘法找到最佳拟合直线，线性几率回归通过对数几率函数转化预测值进行二分类，线性判别分析用于最大化类别间的投影距离。多分类学习通常采用拆分策略如一对一、一对多和多对多方法。类别不平衡问题则可通过欠采样、过采样或预测值再缩放来解决。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

3、线性模型

谈及线性模型，其实我们很早就已经与它打过交道，还记得高中数学必修3课本中那个顽皮的“最小二乘法”吗？这就是线性模型的经典算法之一：根据给定的（x，y）点对，求出一条与这些点拟合效果最好的直线y=ax+b，之前我们利用下面的公式便可以计算出拟合直线的系数a,b（3.1中给出了具体的计算过程），从而对于一个新的x，可以预测它所对应的y值。前面我们提到：在机器学习的术语中，当预测值为连续值时，称为“回归问题”，离散值时为“分类问题”。本篇先从线性回归任务开始，接着讨论分类和多分类问题。

3.1 线性回归

线性回归问题就是试图学到一个线性模型尽可能准确地预测新样本的输出值。

eg例如：通过历年的人口数据预测2017年人口数量。在这类问题中，往往我们会先得到一系列的有标记数据，例如：2000—>13亿…2016—>15亿，这时输入的属性只有一个，即年份；也有输入多属性的情形，假设我们预测一个人的收入，这时输入的属性值就不止一个了，例如：（学历，年龄，性别，颜值，身高，体重）—>15k。

有时这些输入的属性值并不能直接被我们的学习模型所用，需要进行相应的处理，对于连续值的属性，一般都可以被学习器所用，有时会根据具体的情形作相应的预处理，例如：归一化等；对于离散值的属性，可作下面的处理：