【2024】Datawhale X 李宏毅苹果书 AI夏令营 Task2

本文是关于李宏毅苹果书”线性模型“学习内容的记录。

线性模型

线性模型(linear model):将输入的特征xxx(或x\bold{x}x)乘上权重ω\omegaω(或ω\bold{\omega}ω),再加上一个偏置,得到预测的结果。

加粗字母表示向量,而不仅是一个标量。

分段线性曲线

线性模型的局限性:如图1.7所示,(当输入的特征数量为1时,即权重数量只有1个时,)线性模型只能表示直线(即图中的蓝色线),不能表示更复杂的线条(如图中的红线)。这种来自模型的限制称为模型的偏差,无法模拟真实的情况。
在这里插入图片描述
如果需要模拟图1.7中的红色线(分段线性曲线(piecewise linear curve)),可以构建一个函数:一个常数+一群Hard Sigmoid函数(如图1.8所示)。分段线性曲线越复杂,需要的Hard Sigmoid函数越多。
在这里插入图片描述

如果观察输入和输出的关系不是分段线性关系,而是曲线关系(如图1.9所示),可以在曲线上取若干个点,将点相连,即可得到与原曲线接近的分段线性曲线。取的点数量越多、位置适当,得到的分段线性曲线越逼近原连续曲线。分段线性曲线可以逼近任何连续曲线,分段线性曲线可以由一群Hard Sigmoid函数组合得到,即使用足够多的Hard Sigmoid函数可以逼近任何连续曲线。

在这里插入图片描述

与此同时,可以使用Sigmoid函数逼近Hard Sigmoid函数。Sigmoid函数的表达式为
y=c11+e−(b+wx1) y = c \frac{1}{1 + e^{-(b + wx_1)}} y=c1+e(b+wx1)1

y=cσ(b+wx1) y = c\sigma(b + wx_1) y=cσ(b+wx1)

那么,图1.8的红色线可以使用下式逼近:

在这里插入图片描述

如果输入的特征数量不止1个(假设由j个),那么可以写成

在这里插入图片描述

使用线性代数的方法表达式子

在这里插入图片描述

分批量进行梯度下降

在这里插入图片描述

模型变形

除了使用Sigmoid逼近Hard Sigmoid,也可以使用两个ReLU逼近Hard Sigmoid。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

机器学习框架

  • 写出含参数的函数/模型fθ(x)f_{\theta}(x)fθ(x)xxx表示输入,θ\thetaθ表示函数/模型的所有未知参数。

  • 定义损失函数L(θ)L(\theta)L(θ),输入是一组参数,输出是对这组参数的好坏的衡量值。

  • 求解损失函数的最优解,即寻找让L(θ)L(\theta)L(θ)最小的参数θ∗{\theta}^*θ
    θ∗=arg⁡min⁡θL(θ) {\theta}^* = \arg\min_{\theta} L(\theta) θ=argθminL(θ)

  • 使用fθ∗(x)f_{{\theta}^*}(x)fθ(x)计算测试集的输出。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值