李宏毅机器学习任务四

博客介绍了贝叶斯公式、后验概率、先验概率,对比了贝叶斯估计与最大似然函数估计。阐述朴素贝叶斯算法,包括特征值离散和连续时的处理方法。还推导了sigmoid function,分析逻辑回归和线性回归的相同与不同之处,如建模方法、处理问题类型等。

贝叶斯公式

P ( C i ∣ x ) = P ( x ∣ C i ) P ( C i ) ∑ i = 1 c P ( x ∣ C i ) P ( C i ) P(C_{i}|x)=\frac{P(x|C_{i})P(C_{i})}{\sum_{i=1}^{c}P(x|C_{i})P(C_{i})} P(Cix)=i=1cP(xCi)P(Ci)P(xCi)P(Ci)
x为一个样本,是一个特征向量 C为所有类别的集合 C i C_i Ci为第 i i i类。

后验概率

在给定样本X时,计算它属于 C i C_i Ci类的概率,实际上就是条件概率。
由似然函数和先验概率分布相乘并除以归一化常数

先验概率

P ( C i ) P(C_i) P(Ci) i=1,2,…k
是估计 C i C_i Ci类在模型中的概率

贝叶斯估计最大似然函数估计的区别

贝叶斯估计引入了先验概率,通过先验概率和似然概率来求解后验概率。而最大似然估计是直接通过最大化似然概率来求得
引入一个例子:
男性中30%留长头发,女性中60%留长头发。现在看到一个留长头发的人,判断他的性别。
1.使用最大似然估计, m a x ( P ( 长 头 发 ∣ 男 生 ) , P ( 长 头 发 ∣ 女 生 ) ) max(P(长头发|男生),P(长头发|女生)) max(P()P()),则推断这个人是女生
2.使用贝叶斯估计,这里要引入先验概率,男性占比90%,女性占比10%

P ( 男 生 ∣ 长 头 发 ) = P ( 长 头 发 ∣ 男 生 ) P ( 男 生 ) P ( 长 头 发 ) = 0.27 P ( 长 头 发 ) P(男生|长头发)=\frac{P(长头发|男生)P(男生)}{P(长头发)}=\frac{0.27}{P(长头发)} P()=P()P()P()=P()0.27
P ( 女 生 ∣ 长 头 发 ) = P ( 长 头 发 ∣ 女 生 ) P ( 女 生 ) P ( 长 头 发 ) = 0.06 P ( 长 头 发 ) P(女生|长头发)=\frac{P(长头发|女生)P(女生)}{P(长头发)}=\frac{0.06}{P(长头发)} P()=P()P()P()=P()0.06
是男生的概率大,推断这个人是男生

朴素贝叶斯算法

朴素贝叶斯算法是利用贝叶斯公式推断样本x分别属于类别 C i C_i Ci的概率,选出概率最大的那一类,将样本分为此类。
朴素贝叶斯通过训练数据集学习联合概率分布 P ( X , C i ) P(X,C_i) P(X,Ci),对条件概率分布作了条件独立的假设 P ( x ∣ C i ) = ∏ n = 1 N P ( x n ∣ C i ) P(x|C_i)=\prod _{n=1}^{N}P(x_n|C_i) P(xCi)=n=1NP(xnCi)属于生成模型算法 ,是根据联合概率分布,确定后验概率。
样本x是一个向量,特征维为N。
类 别 = a r g m a x c i = P ( C i ) ∏ P ( x n ∣ C i ) 类别=argmax_{c_i}=P(C_i)\prod{P(x_n|C_i)} =argmaxci=P(Ci)P(xnCi)

当特征值为离散的时候

用出现的次数估计条件概率和先验概率

当特征值为连续的时候

1.通常假设这些连续数值为高斯分布,用高斯分布可以将在类别 C i C_i Ci的条件下x的 均值和方差计算出来。
2.大量样本情况下,通过离散化连续值的方法。在训练本较少或者精确的已知分布时,通过概率分布的方法是一个好的选择

推导sigmoid function

在这里插入图片描述
在这里插入图片描述
由上面的推导可以得到
在这里插入图片描述

逻辑回归和线性回归的关系

相同之处:

  1. 都是通过极大似然估计对训练样本建模
    线性回归:假设因变量y服从正态分布的假设,用极大似然估计去选择超参 w w w
    逻辑回归:通过对数似然函数去选择超参 w w w
  2. 在超参求解过程中,都可以利用梯度下降

不同之处:

  1. 逻辑回归处理分类问题,线性回归处理回归问题
  2. 逻辑回归中类别是因变量服从二项分布,线性回归中y是自变量,假设服从高斯分布
    .
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值