通过归纳决策树增强本体
1. 引言
在当今,本体在表示众多现实世界领域的语义方面越来越受欢迎,这使得不同主题的本体数量不断增加。不同的本体构建者、专家和组织创建了大量针对特定应用领域的本体。然而,这些本体可能会与更广泛领域的其他本体存在重叠,甚至可能对相似理论的建模存在不一致性。为了促进这些本体的重用,本文介绍了一种通过补充归纳推导规则来丰富手动创建的本体,并减少不一致性的技术。
该技术的核心是利用从外部数据集执行树学习算法得到的决策树(DT)来扩展现有本体。这些决策树通过从外部数据集中推断出的经验事实来完善本体的定义和术语。
1.1 实际应用场景
- 科学研究领域 :在科学研究中,结果的准确性依赖于底层数据。例如在地质科学中,对岩石类型的鉴定很大程度上依赖于发现的标本以及地质学家对该地区的了解。传统上,研究者可能会结合数据驱动和理论驱动的信息,但由于个人偏见,理论知识的使用可能会因位置分类错误而出现偏差。相比之下,数据驱动的信息能提供更一致且可能更正确的鉴定结果。
- 生物和化学信息领域 :生物和化学信息越来越多地通过语义技术进行发布和共享。例如,化学产品的毒性分析通常通过对化学特征的统计分析来进行,一种流行的方法是通过挖掘经验毒理学数据来开发决策树。然而,在区分有毒和无毒类别时,由于决策树之间的显著重叠以及缺乏不确定性度量,使得创建决策树变得困难,需要添加化学产品结构信息来消除分类规则的歧义。
- 本体匹配领域 :本体匹配是将一个本体中的概念与另一个本体中的概念进行匹配的过程。手动匹配过程中
超级会员免费看
订阅专栏 解锁全文
17

被折叠的 条评论
为什么被折叠?



