周志华《机器学习》读书笔记(2)

本文深入探讨了线性模型的基本概念及应用,详细介绍了如何利用线性组合进行预测,并以西瓜问题为例阐释了线性模型的实际意义。此外还讨论了线性回归在数据集上的应用,包括如何最小化预测误差。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第三章 线性模型

  1. 给定由d个属性描述的示例 x=(x1;x2;...;xd) ,其中 xi x 在第 i 个属性上的取值。线性模型(linear model)试图学得一个通过属性的线性组合来进行预测的函数,即

    f(x)=w1x1+w2x2+...+wdxd+b

    一般用向量形式写成

    f(x)=wTx+b

    其中 w=(w1;w2;...;wd) wb

    线性模型有很好得解析性,例如在西瓜问题中学得 f(x)=0.2x+0.5x+0.3x+1 ,则意味着可通过综合考虑色泽、根蒂和敲声来判断瓜好不好,其中根蒂最重要,而敲声比色泽更重要。

  2. 线性回归。

    • 给定数据集 D={(x1,y1),(x2,y2),(x3,y3),...,(xm,ym)} ,其中 xi=(xi1;xi2;xi3;...;xid)yiR ,线性回归试图学得一个线性模型以尽可能准确的预测实值输出标记。
    • 我们考虑一种最简单的标记:输入属性的数目只有一个。此时我们忽略关于属性的下标,即 D={xi,yi}mi=1
    • 对离散属性,如果属性间存在“序”(order)关系,可通过连续化将其转化为连续值,例如身高中的“高”、“矮”,可转化为 {1.0,0.0} 。三值属性“高度”的取值“高”、“中”、“低”。可转化为k维向量,例如属性“瓜类”中的取值“西瓜”、“南瓜”“黄瓜”可转化为 (0,0,1),(0,1,0),(1,0,0)

    若将无序属性连续化,则会不恰当的引入序关系,对后续处理如距离计算等造成误导。

  3. 线性回归试图学得
    f(xi)=wxi+b
    ,使得
    f(xi)yi
  4. (w,b)=argmin(w,b)i=1m(f(xi)yi)2=argmin(w,b)i=1m(yiwxib)2

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值