1、用你自己的话解释“一个模型具有良好的泛化能力”这句话的含义。
一个模型具有良好的泛化能力意味着它能够在训练数据之外的新数据上表现良好,即可以准确地对未在训练集中出现过的数据进行分类或预测,而不会受到训练数据中噪声和采样偏差的过度影响。
2、简要解释归纳学习的含义。
归纳学习
归纳学习是指在给定以训练集形式存在的有限数据时,尝试归纳出一个函数,该函数能在整个数据空间上近似原始的标记过程,即从训练集的特定实例推广到整个数据空间。
其核心假设是训练集能准确代表整个数据空间,归纳学习假设指出,在足够大的训练示例集上能很好近似目标函数的任何函数,在未观察到的示例上也能很好地近似目标函数。
3、考虑一个包含各种对象的大集合,并将其作为数据宇宙X。现在考虑一个标记函数bird:X → {true, false},该函数将X中的每个对象标记为是否为鸟类。设计一个可以在计算机上实现的模型ˆf:X → {true, false},该模型近似于原始的bird函数。你的特征集是什么?现在取X的一个子集D作为训练数据。分析当该模型应用于D和/或X时,它在哪里以及如何出错。
鸟类标记函数模型设计
设计一个近似鸟类标记函数的模型,可选用的特征集包括:翅膀、羽毛、喙、飞行能力等。
构建模型时,若对象具备上述特征,则标记为鸟类;否则标记为非鸟类。
模型可能在以下情况下出错:
-
特征不全面
例如:蝙蝠有翅膀且能飞行,但不是鸟类。若仅依据翅膀和飞行能力进行判断,就会导致错误。 -
特征判断不准确
例如:鸵鸟有翅膀但不能飞行。若将飞行能力作为绝对判断标准,会导致误判。 -
训练数据有偏差
若训练数据 D 中的鸟类特征过于单一,模型在面对具有其他特征组合的鸟类时容易出错。

最低0.47元/天 解锁文章
2269

被折叠的 条评论
为什么被折叠?



