我们可以采用以下六个分类标准:
- 注释者的数量
- 单个注释者: 在只有一个注释者提供标签的情况下,重点是模拟该个人的特定噪声模式。当专业知识有限或注释任务高度专业化时,这是相关的。例如,BLTM [17] 等方法就是为此设置而设计的,旨在学习捕获注释者标签如何偏离真实标签的转换矩阵。
- 多个注释者: 更常见的情况涉及具有不同专业知识的多个注释者。这带来了汇总不同意见并考虑注释者可靠性差异的挑战。CrowdLayer [53] 和 GeoCrowdNet [13] 等方法是针对此设置量身定制的,结合了特定于注释者的层或正则化技术,以从群体的集体智慧中学习。
- 噪声过渡模型
- 实例无关: 该模型通过假设注释者出错的概率在所有实例中都是一致的,无论其个体特征如何,从而简化了问题。这是 TraceReg [8] 等方法中的一个常见假设,该方法侧重于估计每个注释者的全局混淆矩阵。
- 实例相关: 一种更细致的方法是考虑错误概率可能因每个实例的特定特征而异。这是当前论文的重点,作者提出了一个贝叶斯框架来模拟这种实例相关的噪声。BLTM [17] 中也探讨了这一点,该方法使用深度神经网络来估计实例相关的贝叶斯标签转换矩阵。
- 建模方法
- 贝叶斯: 贝叶斯方法将未知的真实标签和模
本文提出了一种贝叶斯框架,针对多个注释者提供的嘈杂标签进行实例相关噪声的标签校正。通过成对似然比检验算法,该方法能够从注释者的集体智慧中学习,同时考虑每个注释者的专业知识和个体噪声模式。此外,它还具有理论保证,包括后验一致性,并使用尖峰和平板先验促进模型的稀疏性。
订阅专栏 解锁全文
2107

被折叠的 条评论
为什么被折叠?



