本体对齐评估倡议:六年经验总结
1. 引言
在过去十年里,语义技术领域取得了显著发展,这主要得益于构建语义网的理念,即让机器能够访问信息源。网络知识表示语言(如RDF和OWL)的标准化推动了这一发展,基于这些语言,开发出了许多用于语义网的工具,可执行搜索、查询、集成和推理等任务。
然而,要使这些技术在实际应用中大规模采用,关键在于能够根据系统在现实数据上的预期性能来评估其质量。因此,语义技术的系统评估是一个重要课题。评估的主要长期目标是帮助系统开发者改进系统,并帮助用户评估系统是否符合自身需求。评估应持续多年,以衡量该领域的发展,同时也有助于评估绝对结果(系统实现的属性)和相对结果(与其他系统的比较)。
基准测试是一种特殊的评估方式,它是一组明确定义的测试,可用于衡量系统或子系统的结果。基准测试应具有可重复性和稳定性,以便能够反复用于测试系统的改进或退化,并将系统与其他系统进行比较。评估工作的中期目标是建立一组参考测试集或基准套件,用于评估现有工具的优缺点,并比较它们的发展情况。
本文聚焦于本体对齐评估倡议(OAEI),该倡议每年开展本体匹配工具的评估活动。本体匹配在许多应用中是一项重要功能,它是将来自异构源的信息链接到一个可查询和推理的通用模型的基础。OAEI的主要目标是在相同基础上比较系统和算法,让人们能够得出最佳匹配策略的结论,其愿景是通过这些评估,工具开发者能够学习并改进系统,从而推动本体匹配领域的发展。
2. 评估相关工作
目前,语义技术的系统评估总体上落后于其他领域,如定理证明和信息检索,在这些领域,针对标准化数据集进行基准测试是常见做法。标准化评估为系统的公平比较提供了科学依据,也使得难以针对某个系统调
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



