一、模型评估与模型参数的选择
损失函数:若对于给定的输入𝑥,若某个模型的输 出𝑦 '= 𝑓 '(𝑥)偏离真实目标值𝑦,那么就 说明模型存y'偏离𝑦的程度可以用关于𝑦'和𝑦某个函数来表示,作为误差的度量标准;这样的函数L(y,y') 称为损失函数。
数据集:训练集、验证集、测试集
1.误差
1、监督学习——回归
回归问题在生活中非常常见,其最简单的形式是一个连续函数的拟合。
回归问题中通常使用均方损失函数来作为度量模型效果的指标,最简单的求解例子是最小二乘法。
简单线性回归:自变量 x 和因变量 y之间存在一条线性关系:
多元线性回归:假设自变量 和因变量 y之间存在一条线性关系:
线性回归可以预测的场景:
a.预测房价
b.预测销售额、
2、监督学习——分类
想要预测(检测)的目标是猫,那么在数据集中猫为正样本(Positive),其他狗、兔子、狮子这些数据为负样本(Negative)。
将这只猫预测(分类)为狗、兔子、其他预测结果为错(False);将这只猫预测为猫,预测结果为对(True)。
准确率(Accuracy):对于测试集中D个样本,有k个被正确分类,D-k个被错误分类,则准确率为:
精确率(查准率)- Precision:所有被预测为正样本中实际为正样本的概率
精准率代表对正样本结果中的预测准确程度。
准确率则代表整体的预测准确程度,既包括正样本,也包括负样本。
召回率(查全率)- Recall:实际为正样本中被预测为正样本的概率
召回率的应用场景:
比如拿网贷违约率为例,相对好用户,我们更关心坏用户,不能错放过任何一个坏用户。因为如果我们过多的将坏用户当成好用户,这样后续可能发生的违约金额会远超过好用户偿还的借贷利息金额,造成严重偿失。
召回率越高,代表实际坏用户被预测出来的概率越高,它的含义类似:宁可错杀一千,绝不放过一个。
召回率越高,也代表网络可以改进的空间越大。
1.监督学习与非监督学习主要针对数据集定义。
2.有监督数据集需要人工标注,成本较为昂贵,但是在训练模型时往往能够保障效果。
3.无监督数据集一般不需要过多人工操作,可以通过爬虫等方式自动大量获得。
4.由于没有监督信息的约束,需要设计巧妙的学习算法才能有效利用无监督数据集训练模型,不过大量廉价数据可以从另一个方面提高模型性能。
5.模型评估需要根据模型的训练历史判断模型是否处于欠拟合或过拟合状态。尽管有一定的规律作为指导,而且有一些工具可以辅助分析,但是模型的评估过程一般需要较为丰富的经验。