机器学习基础学习笔记（五）线性回归

最新推荐文章于 2024-12-04 10:04:48 发布

原创最新推荐文章于 2024-12-04 10:04:48 发布 · 619 阅读

1 ·

CC 4.0 BY-SA版权

深度学习学习笔记专栏收录该内容

11 篇文章

订阅专栏

本文深入解析了线性回归模型，包括简单回归与多元回归的概念，介绍了经验风险最小化、结构风险最小化、最大似然估计及最大后验估计四种参数学习方法。探讨了在不同条件下如何选择合适的算法以优化模型，如最小二乘法、岭回归等。

以下内容均为https//nndl.github.io/nndl-book.pdf的学习笔记。

机器学习的简单示例-线性回归

线性回归（Linear Regression）概述
- 简介
线性回归之参数学习

线性回归（Linear Regression）概述

简介

是一种对自变量和因变量之间关系进行建模的回归分析．自变量数量为1 时称为简单回归，自变量数量大于1 时称为多元回归．
机器学习中，，自变量就是样本的特征向量𝒙 ∈ ℝ𝐷（每一维对应一个自变量，列向量），因变量是标签𝑦，这里𝑦 ∈ ℝ 是连续值（实数或连续整数）．假设空间是一组参数化的线性函数：
在这里插入图片描述
下面用增广向量来简要表示上述线性模型：

线性回归之参数学习

任务：给定一组包含𝑁 个训练样本的训练集𝒟 = {(𝒙(𝑛), 𝑦(𝑛))} n=[1,N],**学习一个最优的线性回归的模型参数𝒘．**下面从四个角度进行分析：

1.经验风险最小化

1)求解步骤

平方损失函数衡量真实标签和预测标签之间的差异。训练集上的经验风险定义为：
在这里插入图片描述

2)求解条件

𝑿𝑿T ∈ ℝ(𝐷+1)×(𝐷+1) 必须存在逆矩阵
–> 𝑿𝑿T 是满秩的（rank(𝑿𝑿T) = 𝐷 + 1
–> 行列式不为0
–>𝑿 中的行向量之间是线性不相关的，每个特征不相关。
一种常见的𝑿𝑿T 不可逆情况是样本数量𝑁 小于特征数量(𝐷 + 1)，𝑿𝑿T的秩为𝑁．这时会存在很多解𝒘∗，可以使得ℛ(𝒘∗) = 0．