2、监督学习入门:基础概念与方法解析

监督学习入门:基础概念与方法解析

1. 监督学习概述

监督学习是机器学习中的一个重要分支,它的核心在于利用训练数据来学习输入变量 (x) 和输出变量 (y) 之间的关系,从而对新的、未知的输入数据进行输出预测。

1.1 从标记数据中学习

在大多数监督学习应用中,输入 (x) 和输出 (y) 之间的关系往往难以明确描述,可能过于复杂或未知。因此,传统的基于规则的计算机程序难以解决这类问题。监督学习则通过从包含输入 - 输出值对的训练数据中学习,来建立 (x) 和 (y) 之间的关系。

训练数据由多个输入 - 输出数据点 ((x_i, y_i)) 组成,记为 (T = {x_i, y_i}_{i = 1}^{n})。每个数据点提供了 (y) 如何依赖于 (x) 的一个快照,监督学习的目标就是从这些数据中提取尽可能多的信息。这里假设每个数据点是(概率上)独立的,这排除了时间序列分析等需要考虑数据相关性的应用。

训练数据包含输入值 (x_i) 和输出值 (y_i),这就是“监督”学习的由来。可以说每个输入 (x_i) 都伴随着一个标签 (y_i),即标记数据。在某些应用中,只需同时记录 (x) 和 (y);而在另一些应用中,输出 (y) 需要领域专家对训练数据输入 (x) 进行标记。例如,在心血管疾病应用中,心脏病专家需要查看所有训练数据输入(心电图信号)(x_i),并为变量 (y_i) 分配对应信号中所显示的心脏状况标签。整个学习过程由领域专家“监督”。

输入 (x) 通常是一个 (p) 维向量,记为 (x = [x_1 x_2 \cdots x_p]^T),其中每个元素代表与特定应用相关的信息,如室外温度或失业率。在许多

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值