多语言本体开发与元数据词汇表的新进展
1. 协作式多语言本体开发:以Wikidata为例
1.1 引言
近年来,本体开发逐渐向协作式方向转变,对于涉及来自不同国家的多语言贡献者的大规模项目而言,协作式本体开发尤为重要。Wikidata作为一个典型案例,展示了社区驱动的方法如何用于开发多语言本体并构建知识库。与DBpedia等类似项目相比,Wikidata的社区驱动方法是其显著区别。
1.2 Wikidata概述
Wikidata有两种类型的页面:项目页面和属性页面。项目通过以“Q”开头后跟数字的标识符来识别,属性则以“P”开头后跟数字。项目页面描述实体,包含多个描述该实体的陈述。例如,Douglas Adams的标识符是Q42,Wikidata本身是Q2013。属性的例子有“instance of”(P31)和“subclass of”(P279)。
陈述是一个三元组,项目是主体,后面跟着属性和值。一个属性可能有多个值,每个值与项目和属性标识符构成一个单独的陈述。属性值可以是常量或另一个项目的标识符。每个陈述可以有一个或多个参考,参考包括相应的维基百科页面、书籍、网页等。此外,陈述可能有限定符,例如“height”(P2048)属性需要“units”(P2237)等附加属性。
项目和属性仅通过标识符识别,用户可以选择任何语言,项目会以所选语言进行描述。每个项目页面可选地链接到不同语言的相关维基百科页面。属性页面与项目页面类似,关键陈述是属性值允许的数据类型。每个属性和项目在维基百科支持的每种语言中都有标签、描述和别名,这些值由社区成员定义。
从用户界面,用户可以使用标签、描述和别名搜索项目和属
超级会员免费看
订阅专栏 解锁全文
95

被折叠的 条评论
为什么被折叠?



