监督学习
在监督学习中,我们得到了一个数据集,并且已经知道我们的正确输出应该是什么样子,并且认为输入和输出之间存在关系。
监督学习问题分为“回归”和“分类”问题。在回归问题中,我们试图预测连续输出中的结果,这意味着我们试图将输入变量映射到某个连续函数。在分类问题中,我们改为尝试预测离散输出中的结果。换句话说,我们正在尝试将输入变量映射为离散类别。
给定有关房地产市场上房屋大小的数据,请尝试预测其价格。价格作为规模的函数是一个连续的输出,因此这是一个回归问题。
我们可以通过输出有关房屋是否“以高于或低于要价的价格出售”的输出,从而将这个示例转变为分类问题。在这里,我们根据价格将房屋分为两个独立的类别。
范例2:
(a)回归-给定一个人的照片,我们必须根据给定的照片来预测他们的年龄
(b)分类-对于患有肿瘤的患者,我们必须预测肿瘤是恶性还是良性的。