机器学习中的模型评估、选择与无监督学习
1. 模型参数与重置
在使用多层感知器(MLPs)时,有一些参数需要调整以获得最佳结果,这些参数及其定义可在用户指南中找到。开始使用MLPs时,建议使用 ‘adam’ 和 ‘l-bfgs’。
在scikit - learn模型中,调用 fit 方法会重置模型之前学到的所有内容。例如,在一个数据集上构建模型,然后在另一个数据集上再次调用 fit ,模型会“忘记”从第一个数据集学到的所有内容。多次调用 fit 的结果与在“新”模型上调用 fit 相同。
2. 分类器的不确定性估计
分类器提供预测不确定性估计是scikit - learn接口的一个有用功能。在实际应用中,我们不仅关心分类器对某个测试点的预测类别,还关心其预测的确定性。例如在医疗癌症检测应用中,假阳性预测可能导致患者接受额外检查,而假阴性预测可能导致严重疾病得不到治疗。
scikit - learn中有两个函数可用于从分类器获取不确定性估计: decision_function 和 predict_proba 。大多数分类器至少具备其中一个,很多分类器两者都有。下面以 GradientBoostingClassifier 为例,在一个合成的二维数据集上进行说明:
from sklearn.ensemble import GradientBoosting
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



