数据库新视图学习及其在乳腺摄影中的应用
1. 引言
统计关系学习(SRL)专注于从关系数据库中学习统计模型的算法。它在处理多表领域、表示同一表不同行之间的关系以及整合多个不同数据库的数据方面,超越了贝叶斯网络学习和相关技术。然而,目前的SRL技术只能使用数据库中现有的表和字段,而许多数据库用户发现定义数据库的替代视图(即可以从现有字段计算得出的额外字段或表)是有益的。
我们通过添加学习新字段的能力来增强SRL算法。这些新字段是根据现有字段和背景知识有意定义的,在数据库术语中,它们构成了数据库的学习视图。我们使用归纳逻辑编程(ILP)来学习有意定义新字段的规则,并提出了两种不同的方法来实现这一目标。
我们选择乳腺摄影领域作为视图学习的具体应用,原因如下:
- 这是一个重要的实际应用,最近在收集大量数据方面取得了进展。
- 我们可以访问专家开发的系统,这为评估我们的工作提供了参考。
- 大部分示例为阴性,这种分布偏差在多关系应用中很常见。
- 我们的数据由单个表组成,这使我们能够将我们的技术与标准命题学习进行比较。
2. 乳腺摄影中的视图学习
为40岁以上不断增加的女性提供乳腺癌筛查是一项巨大的挑战。乳腺摄影筛查的成本效益取决于高灵敏度和高特异性的持续平衡。专科乳腺摄影专家在这方面表现出色,而普通放射科医生的假阳性率和活检率较高,降低了乳腺摄影的阳性预测值。
贝叶斯网络是一种概率图形模型,已应用于乳腺摄影数据的乳腺癌诊断。例如,图1展示了由专科乳腺摄影专家开发的贝叶斯网络结构。
| 患者 |
|---|
超级会员免费看
订阅专栏 解锁全文
1136

被折叠的 条评论
为什么被折叠?



