主动学习中的模型预测解读与数据利用
在机器学习领域,主动学习是一种强大的技术,它能够让模型在学习过程中更高效地利用数据。下面我们将深入探讨如何解读模型预测和数据,以支持主动学习,以及构建获取人工标签的接口等内容。
模型预测与数据解读
几乎所有监督式机器学习模型都会给出两个关键信息:预测标签(或一组预测)以及与每个预测标签相关联的数值。这些数值通常被解释为预测的置信度,但实际情况可能因数值的生成方式而异。
例如,对于一条可能与灾难相关的消息,模型的预测结果如下:
{
"Object": {
"Label": "Not Disaster-Related",
"Scores": {
"Disaster-Related": 0.475524352,
"Not Disaster-Related": 0.524475648
}
}
}
在这个预测中,消息被预测为“与灾难无关”,置信度为 52.4%。这意味着系统认为该预测正确的可能性为 52.4%。从任务的角度来看,由于“与灾难相关”的可能性仍相对较高,因此有必要让人对结果进行审核。如果该消息实际上与灾难相关,那么模型就出现了错误预测,将其添加到训练数据中可以避免错过类似的示例。
置信度排序
假设我们有另一条消息的预测结果如下:
{
"Object": {
"Label":
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



