
/study/AI/机器学习/西瓜书-学习笔记
文章平均质量分 83
《机器学习》书籍的学习笔记
会有钱的-_-
一只小菜鸟
展开
-
西瓜书-2习题
ch2模型评估与选择-习题部分,对所学进行融汇,尤其2.3节性能度量部分涉及较多,对于其他一些知识仍存疑。原创 2022-08-30 16:15:56 · 1364 阅读 · 1 评论 -
西瓜书-2.4模型评估与选择
学习器需要用某种实验评估方法来测得学习器的某个性能度量结果,并借此进行性能比较,然后用统计假设检验提供的依据,以错误率为性能度量,以此进行性能比较。原创 2022-08-29 14:50:17 · 623 阅读 · 0 评论 -
西瓜书-2.5偏差与方差
利用“偏差-方差分解”工具解释泛化性能,并拆解出影响期望泛化错误率的因素。原创 2022-08-29 14:41:08 · 503 阅读 · 0 评论 -
西瓜书-2.3性能度量
学习器的优劣需要依据一定性能度量。原创 2022-08-24 21:37:58 · 524 阅读 · 0 评论 -
西瓜书-2.2评估方法
为对模型泛化性能增强,对数据集D进行合理划分,并且进行调参。原创 2022-08-15 21:52:39 · 556 阅读 · 0 评论 -
西瓜书-2.1经验误差与过拟合
文章目录经验误差与过拟合术语问题解决经验误差与过拟合术语错误率分类错误的样本数占总样本的比例。精度=1 - 错误率。误差:指误差期望。学习器的实际预测输出与样本的真实输出之间的差异。在不同数据集上的误差也有区别,如下:训练误差 或 经验误差:训练集。泛化误差:新样本。P问题(P:polynomial)存在多项式时间算法的问题。(多项式时间即算法中O(n^2))NP问题(N:non-deterministic非确定性)不确定1个问题是否存在多项式时间内的算原创 2022-05-17 20:21:01 · 423 阅读 · 0 评论 -
西瓜书-1.4归纳偏好
文章目录归纳偏好描述问题解决归纳偏好作用偏好的建立奥卡姆剃刀(`Occam's razor`)NFL定理(No Free Lunch Theorem)归纳偏好核心:学习算法自身的归纳偏好与问题是否匹配,往往会起到决定性作用。描述基于学习得到相关模型,对应了假设空间中的一个假设。但是在版本空间(假设集合)中,有多个假设,会导致对应的模型在面临新样本的时候,产生不同的输出。问题在诸多假设中,若想要得到理想输出,应该采用哪一种模型(或假设)?解决对于一个具体的学习算法,必须要产生一个模型,而其自原创 2022-04-25 20:43:55 · 703 阅读 · 0 评论 -
西瓜书-1.3假设空间
文章目录假设空间假设空间演绎(一般到特殊的特化)归纳(特殊到一般的泛化)归纳学习:从样例中学习。广义:从样例中学习。狭义:从训练数据中学得概念,——亦称概念学习、概念形成。概念学习,最基本:布尔概念学习,即对‘是’、‘不是’这样的可表示为0/1布尔值的目标概念的学习。案例——西瓜布尔表达式:好瓜↔(色泽=?)∧(根蒂=?)∧(敲声=?)<?表示未确定值>好瓜 \leftrightarrow (色泽=?)\wedge(根蒂=?)\wedge(敲原创 2022-04-24 20:08:13 · 467 阅读 · 0 评论 -
西瓜书-1.2术语
文章目录ch1-绪论1.2 基本术语数据术语1类术语2类ch1-绪论1.2 基本术语数据(色泽=青绿;根蒂=蜷缩;敲声=浊响),(色泽=乌黑;根蒂=稍蜷;敲声=沉闷),(色泽=浅自;根蒂=硬挺;敲声=清脆) ,…术语1类示例:一条数据。数据集:一组记录的集合。样本:一条记录or 一个数据集,取决于上下文。属性attribute 或 特征feature、属性值attribute value如:色泽(特征)–青绿(属性值)。PS:下属统称:特征feature原创 2022-04-19 22:41:12 · 252 阅读 · 0 评论