机器学习基础入门
1. 引言
本文旨在回顾与深度学习相关的机器学习基本概念。由于无法涵盖机器学习的所有方面,对于希望深入了解的朋友,可查阅相关资料。
我们将从监督式机器学习的基本学习框架和一般学习过程开始介绍。接着讨论机器学习理论的一些核心概念,如 VC 分析和偏差 - 方差权衡,以及它们与过拟合的关系。还会介绍各种模型评估、性能和验证指标。我们会从线性判别分类器开始,介绍一些基本的线性分类器,如线性回归、感知机和逻辑回归。然后阐述非线性变换的一般原理,并重点介绍支持向量机和其他非线性分类器。在讨论这些主题时,会引入正则化、梯度下降等核心概念,并探讨它们对机器学习有效训练的影响。随后介绍生成式分类器,如朴素贝叶斯和线性判别分析。接着展示如何通过线性算法实现基本的非线性变换。还会强调常见的特征变换,如特征选择和降维技术。最后,通过马尔可夫链引导大家进入序列建模的世界,并详细介绍两种非常有效的序列建模方法:隐马尔可夫模型和条件随机场。最后会通过一个实际问题和数据集进行监督式机器学习的详细案例研究,将相关概念付诸实践。
2. 监督式学习:框架和形式定义
监督式机器学习是从“神谕”提供的答案(标签或真实值)中进行广义学习的任务。例如学习区分苹果和橙子。监督式学习过程的各个组件如下:
- 输入空间和样本 :
- 特定学习问题(如区分苹果和橙子)的所有可能数据的总体用任意集合 X 表示。样本可以从总体 X 中以未知的概率分布 P(X) 独立抽取,形式上表示为 (X = {x_1,x_2,\cdots,x_n}),且 (X \subseteq X)。
- 从输入空间 X 中抽取的集合 X 中的单个数据点
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



