《机器学习》——第三章 线性模型

本文详细介绍了线性模型,包括最小二乘法、对数几率回归与线性回归的区别联系,以及线性判别分析。通过最小二乘法估计对数几率回归参数,并利用极大似然估计构建高阶可导凸函数。此外,讨论了OvO、OvR、ECOC等多分类策略,以及类别不平衡问题及其缓解方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、最小二乘的原则是什么?写出多元线性回归的参数估计

最小二乘法指基于均方误差最小化来进行模型求解的方法,故最小二乘的原则是:均方误差最小。

2、“对数几率”回归和“线性”回归的区别和联系。

对数几率回归是考虑到二分类问题引入的一种方法。
理想状态下是阶跃函数完成二分类:
y = { 0 , z &lt; 0 0.5 , z = 0 1 , z &gt; 0 y = \left\{ \begin{array}{rcl} 0, &amp; &amp; {z &lt; 0}\\ 0.5, &amp; &amp; {z = 0}\\ 1, &amp; &amp; {z &gt; 0}\\ \end{array} \right. y=0,0.5,1,z<0z=0z>0
然而阶跃函数不可导,可以用对数几率函数代替,也就是令:
y = 1 1 + e − z y =\frac{1}{1+e^{-z}} y=1+ez1
其中 z z z是线性模型的预测值,这是一种Sigmoid函数。上式可以变化为:
ln ⁡ y 1 − y = z = w T x + b \ln\frac{y}{1-y} =z=\bm{w}^T\bm{x}+b ln1yy=z=wTx+b
可以将上式中 y y y 视为 x \bm{x} x为正例的几率,( 1 − y 1-y 1y) 视为 x \bm{x} x为反例的几率,两者的比值成为几率,对几率取对数便得到对数几率。实际上,上式对应的模型是用线性回归的结果逼近真实标记的对数几率,所以称为对数几率回归,它实际是一种分类学习方法

联系:它们都是用的广义线性回归的模型。
区别对数几率回归用来完成二分类任务,线性回归完成回归任务。
在这里插入图片描述

阶跃函数与对数几率函数


3、用最小二乘法估计对数几率回归的参数

对数几率回归的模型为:
f ( x ) = 1 1 + e − ( w T x + b ) f(x) =\frac{1}{1+e^{-(\bm{w}^T\bm{x}+b)}} f(x)=1+e(wTx+b)1
使模型求出的 f ( x ) f(x) f(x) 与真实分类 y y y 之间的均方误差最小:
m i n ∑ i = 1 m ( f ( x i ) − y i ) 2 ⇒ ( w , b ) = arg ⁡ min ⁡ ∑ i = 1 m ( f ( x i ) − y i ) 2 min \sum^m_{i=1}(f(x_{i})-y_{i})^2 \Rightarrow (\bm w, b) = \arg \min\sum^m_{i=1}(f(x_{i})-y_{i}) ^2 mini=1m(f(xi)yi)2(w,b)=argmini=1

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值