初次使用protege5.0构建本体。小demo展示:

建立步骤如下:
1、建立类
edit-creat new-输入类名


或者直接点击左上角(红框标出来了)小图标创建类更方便:

2、建立子类
右键创建好的类-add subClass

3、建立属性
选中object property hierarchy-owl:topObjectProperty,创建属性(同样是点击左上角那个小图标)


4、OWL Viz可视化
需要先安装graphviz(http://www.graphviz.org/download/),配置好环境变量。
选中Windows-tabs-OWL Viz,就可以可视化刚才建立的本体了。

顺带,再理一下几个概念:
1. 本体(Ontology)
本体是用于描述一个领域的术语集合,其组织结构是层次结构化的,可以作为一个知识库的骨架和基础。
Perez等人用分类法组织了Ontology,并归纳出本体的五个基本构成元素(建模元语),即:
①类(Classes)或概念(Concepts);
② 关系(Relations);
③ 函数(Functions);
④ 公理(Axioms);
⑤ 实例(Instances)。
基本的关系有4种:

- 本体构建的目标
旨在获取、描述和表示相关领域的知识,提供对该领域知识的共同理解,确定领域内共同认可的词汇,提供该领域特定的概念定义和概念之间的关系,提供该领域中发生的活动以及该领域的主要理论和基本原理,达到人机交流的效果。
- 本体的分类
根据应用主题可分为5类: 领域本体、通用或常识本体、知识本体、语言学本体和任务本体。
根据详细程度和领域依赖度可分为4类:顶级本体(top-level Ontologies)、领域本体(domain Ontologies)、任务本体(task Ontologies)和应用本体(application Ontologies)。

2. 领域本体(Domain ontology)
领域本体是描述指定领域知识的一种专门本体,它给出了领域实体概念及相互关系领域活动以及该领域所具有的特性和规律的一种形式化描述。
- 领域本体构建的作用
明确专业术语、关系及其领域公理, 使其形式化;
在人与人之间、人与机器之间达到共享;
实现一定程度的领域知识复用。
- 领域本体构建主要方法
手工构建;
复用已有本体(半自动构建);
自动构建本体。
3. OWL ( Web Ontology Language)
OWL 是一门供处理 web 信息的语言。W3C提出了OWL语言扩展RDF(S),作为在语义网上表示本体的推荐语言。
OWL的三个子语言:OWL Lite, OWL DL, OWL Full。

OWL2的三大子语言:OWL2RL,OWL2QL,OWL2EL

4. RDF/RDF Schema (RDFS)
4.1 RDF
RDF 使用 Web 标识符 (URIs) 来标识资源。使用属性和属性值来描述资源。
- RDF的规则
资源、属性和属性值的组合可形成一个陈述(被称为陈述的主体、谓语和客体)。
资源是可拥有 URI 的任何事物,比如 " http://www. w3school.com.cn/rdf " 属性是拥有名称的资源,比如 "author" 或 "homepage" 属性值是某个属性的值,比如 "David" 或 " http://www. w3school.com.cn " (请注意一个属性值可以是另外一个资源)

RDF 的主要元素是 <RDF> 以及可表示某个资源的 <Description> 元素。
RDF 容器用于描述一组事物。如<Bag>、<Seq> 以及 <Alt>这些元素用于描述组。
<rdf:Bag> 元素用于描述一个规定为无序的值的列表。
<rdf:Bag> 元素可包含重复的值。
<rdf:Seq> 元素用于描述一个规定为有序的值的列表(比如一个字母顺序的排序)。
<rdf:Bag> 元素可包含重复的值。
<rdf:Alt> 元素用于一个可替换的值的列表(用户仅可选择这些值的其中之一)。
注:在 RDF 中,这些“值的列表”被称为成员(members)。
因此,可以说:
一个容器是一个包含事物的资源
被包含的事物被称为成员(不能称为“值的列表”)。
RDF 集合用于描述仅包含指定成员的组。集合是通过属性 rdf:parseType="Collection" 来描述的。
4.2 RDFS
RDF Schema (RDFS) 是对 RDF 的一种扩展。
RDF 通过类、属性和值来描述资源。此外,RDF 还需要一种定义应用程序专业的类和属性的方法。应用程序专用的类和属性必须使用对 RDF 的扩展来定义。RDF Schema 就是这样一种扩展。
RDF Schema 不提供实际的应用程序专用的类和属性,而是提供了描述应用程序专用的类和属性的框架。RDF Schema 中的类与面向对象编程语言中的类非常相似。这就使得资源能够作为类的实例和类的子类来被定义。


5. IRI( Internationalized Resource Identifiers)

IRI即“国际化资源标识符”,可以类比于URI ,区别在于 URI 只能使用英文字符,所以没有办法很好的国际化兼容不同的文字语言,所以 IRI 就引入了 Unicode 字符来解决这个兼容问题,最后就有了国际化资源标识符(IRI)。
protege中的ontology IRI,是默认的 IRI 路径(不可随意更改,必须符合 RDF 文件规则)。
参考资料:
[1]王昊奋,漆桂林,陈华钧.知识图谱方法、实践与应用[M].北京:电子工业出版社,2019.8
[2]https://blog.youkuaiyun.com/weixin_43685578/article/details/84941734
[3]https://blog.youkuaiyun.com/u013263092/article/details/46327689
[4]https://www.zhuanzhi.ai/document/9bf8a6e9c903d72eb81731a3583ccdc7
[5]https://zhuanlan.zhihu.com/p/136567659
[6]movie 本体构建:https://zhuanlan.zhihu.com/p/32389370
[7]https://www.w3school.com.cn/rdf/rdf_rules.asp