课程笔记——Semi-supervised半监督学习

1.半监督学习

1.1 定义

  • 监督学习样本数据 例如:图片+标签
  • 半监督学习样本数据 例如:R个图片+标签,U个图片,通常U >> R。分类:transductive learning、inductive learning
  • 直推式学习(transductive learning):将无标签数据作为测试数据。该做法不算是欺骗(当应用label才算欺骗,该做法仅应用feature)
  • 归纳学习(inductive learning):无标签数据不作为测试数据,在training时还不知道testing set是什么样子,即事先无法利用testing set,需要先训练好model。
  • 采用直推式学习/归纳学习取决于testing set是否已知

1.2 为什么采用半监督学习

  • 不缺数据,缺带标签的数据且收集昂贵
  • 人类行为也是在做半监督学习

1.3 课程内容

  • 生成模型的半监督学习
  • 低密度分离的假设
  • 平滑性假设
  • 更好表示

2.生成模型的半监督学习

在监督学习中:已知样本来自C1 C2两类,我们统计得到数据的先验概率P(Ci)和分类概率P(x|Ci),假设每类数据均服从高斯分布,则其均值分别为μ\muμ1 μ\muμ2,方差为Σ\SigmaΣ,由此可估测一个给定数据分类概率为:
在这里插入图片描述
而当给定一些无标签数据时,各概率数值的估测均会受到影响,故最终会影响分类 影响decision boundary。那么如何有效分类?做法如下:

  • 初始化 θ\thetaθ={ P(C1),P(C2),μ\muμ1,μ\muμ2,Σ\SigmaΣ },初始化方法:可以用有标签数据先估测、random等方法

  • 计算无标签数据的Pθ(C1|xμ),该值取决于θ\thetaθ

  • 更新模型
    原来没有无标签数据时P(C1)=N 1 NP(C_1)=\frac{N~1~}{N}P(

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值