台大机器学习基石 Lecture 3 - Types of Learning

本文深入探讨了机器学习的不同方面,包括输出空间如二元分类、回归和结构化学习;数据标签涵盖监督、无监督、半监督及增强学习;协议涉及批处理、在线和主动学习;以及输入空间从具体到抽象的各类数据处理方式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本章主要讲了不同的学习方法,主要有Output Space, Data Label, Protocol, Input Space四个方面。

在上图[ ]以及后文中黄色标记的内容为本课程中主要讲解的内容。

Learning with Different Output Space \large y

  • binary classificationy = \left \{ -1 , +1\right \}
  • multiclass classification: y = \left \{1, 2, 3 ..., K \right \}
  • regressiony=\mathbb{R}
  • structured learning: y=structures。输出空间包含了某种结构在里面,它的一些解法通常是从多分类问题延伸而来的,比较复杂。

Learning with Different Data Label \large y_n

  • supervised: all y_n。监督学习,即给出所有样本的y_n
  • unsupervised: no y_n。无监督学习,即不给出样本的y_n,通过clustering(聚类)的方法。
  • semi-supervised: some y_n。给出部分样本的y_n,大多数的样本没有,避免了昂贵的标记成本。
  • reinforcement learning: implicit y_n by goodness(\tilde{y}_n)

增强学习中,我们给模型或系统一些输入,但是给不了我们希望的真实的输出y,根据模型的输出反馈,如果反馈结果良好,更接近真实输出,就给其正向激励,如果反馈结果不好,偏离真实输出,就给其反向激励。不断通过“反馈­修”这种形式,一步一步让模型学习的更好,这就是增强学习的核心所在。

Learning with Different Protocol \large f\Rightarrow (x_n, y_n)

其实就是不同的学习方法,主要分为以下三类:

  • batch: 即是一次性拿到所有的数据集。
  • online: 在线学习模型,通过不断更新数据,可以在线更新模型。一些batch learning的模型也可以修改为online learning的模型,比如PLA模型的修正就可以在线进行。
  • active: 让模型具有主动问问题的能力,也就是在获取label比较困难的时候可以主动提出需求以节约成本。

Learning with Different Input Space \large x

输入数据的不同类型?

  • concrete: each dimension of \large x\subseteq \mathbb{R}^{d} represents ‘sophisticated physical meaning’,具有具体意义的特色输入对机器学习最简单。
  • raw: often need human or machines to convert to concrete ones,原始数据需要转换成对应的具体特征。
  • abstract: 特征完全抽象,没有实际的物理含义。所以对于机器学习来说是比较困难的,需要对特征进行更多的转换和提取。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值