机器学习笔记——百度云盘资料

本文以银行贷款预测为例,深入浅出地介绍了线性回归的基本概念。通过将顾客的工资和年龄作为特征,贷款值作为标签,阐述了回归问题的本质及线性回归的目标:即寻找一条最佳拟合线来预测连续值。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

\begin{align*} \log L\left ( \boldsymbol{\theta } \right )&=\sum_{i=1}^{n}\log \frac{1}{\sqrt{2\pi }\sigma }exp\left ( -\frac{\left ( y^{\left ( i \right )}-\boldsymbol{\theta }^{T} x^{\left ( i \right )}\right )^{2}}{2\sigma ^{2}} \right )\\&=m\log \frac{1}{\sqrt{2\pi }\sigma }-\frac{1}{\sigma ^{2}}\cdot \frac{1}{2}\sum_{i=1}^{n}\left ( y^{\left ( i \right )}-\boldsymbol{\theta ^{T}} x^{\left ( i \right )}\right )^{2} \end{align*}

J\left ( \theta \right )=\frac{1}{2}\sum_{i=1}^{n}\left ( y^{\left ( i \right )}-\boldsymbol{\theta ^{T}}x^{i} \right )^{2}

J\left ( \theta \right )=\frac{1}{2}\sum_{i=1}^{n}\left ( h_{\theta } \left ( x^{\left ( i \right )} \right )-y^{\left ( i \right )}\right )^{2}=\frac{1}{2}\left ( \boldsymbol{X} \boldsymbol{\theta }-y\right )^{T}\left ( \boldsymbol{X} \boldsymbol{\theta }-y \right )

\nabla J\left ( \theta \right )=\nabla \left ( \frac{1}{2}\left ( \boldsymbol{X} \boldsymbol{\theta }-y \right )^{T} \left ( \boldsymbol{X} \boldsymbol{\theta }-y \right )\right )=\nabla \left ( \frac{1}{2} \left ( \boldsymbol{\theta }^{T} \boldsymbol{X}^{T}-y^{T}\right )\left ( \boldsymbol{X} \boldsymbol{\theta }-y \right )\right )\\=\nabla \left ( \frac{1}{2} \left ( \boldsymbol{\theta } ^{T}\boldsymbol{X}^{T}\boldsymbol{X}\boldsymbol{\theta }-\boldsymbol{\theta }^{T}\boldsymbol{X}^{T}y-y^{T}\boldsymbol{X}\boldsymbol{\theta }+y^{T}y\right )\right )\\=\frac{1}{2}\left ( 2\boldsymbol{X}^{T} \boldsymbol{X}\boldsymbol{\theta }-\boldsymbol{X}y-\left ( y^{T}\boldsymbol{X} \right )^{T}\right )=\boldsymbol{X}^{T}\boldsymbol{X}\boldsymbol{\theta }-\boldsymbol{X}^{T}y

\boldsymbol{\theta }=\left ( \boldsymbol{X}^{T} \boldsymbol{X}\right )^{-1}\boldsymbol{X}^{T}y

g\left ( z \right )\frac{1}{1+e^{-z}}

h_{\theta }\left ( x \right )=g\left ( \boldsymbol{\theta } ^{T}x\right )=\frac{1}{1+e^{-\boldsymbol{\theta } ^{T}x}}

\theta _{0}+\theta _{1}x_{1}+\cdots +\theta _{i}x_{i}=\sum_{i=1}^{m}\theta _{i}x_{i}=\boldsymbol{\theta }^{T}\boldsymbol{X}

P\left ( y=1|x;\theta \right )=h_{\theta }\left ( x \right )\\ P\left ( y=0 |x;\theta\right )=1-h_{\theta }\left ( x \right )\\ \Rightarrow P\left ( y|x;\theta\right )=\left( h_{\theta }\left ( x \right ) \right)^{y}\left ( 1-h_{\theta }\left ( x \right ) \right )^{1-y}

L\left ( \theta \right )=\prod_{i=1}^{m}P\left ( y_{i}|x;\theta \right )=\prod_{i=1}^{m}\left( h_{\theta }\left ( x_{i} \right ) \right)^{y_{i}}\left ( 1-h_{\theta }\left ( x_{i} \right ) \right )^{1-y_{i}}

l\left (\theta \right )=\log L\left ( \theta \right )=\prod_{i=1}^{m}\left ( y_{i}\log h_{\theta }\left ( x_{i} \right ) +\left ( 1-y_{i} \right )\log \left ( 1-h_{\theta }\left ( x_{i} \right ) \right )\right )

l\left ( \theta \right )=\log \left ( y_{i}\log h_{\theta }\left ( x_{i} \right )+\left ( 1-y_{i} \right )\log \left ( 1-h_{\theta } \left ( x_{i} \right )\right ) \right )

=-\frac{1}{m}\sum_{i=1}^{m}\left (h_{\theta }\left ( x_{i} \right )-y_{i} \right )x_{i}^{j}

\theta _{j}:=\theta _{j}-\alpha \frac{1}{m}\sum_{i=1}^{m}\left ( h_{\theta }\left ( x_{i} \right )-y_{i} \right )x_{i}^{j}

 

 

第一课:线性回归

假如银行是根据顾客的工资和年龄来预测贷款多少,这样工资和年龄就是特征,而贷款值就是标签,这就是一个回归问题:就是我们在预测时候,得到的结果是一个完整的值(这个值要求在一定区间内)。从数学层面上来讲,两个特征分别是两个坐标,而标签就是函数值,而线性回归就是寻找一条线来最好地拟合我们的数据点。
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值