本体库的概念
本体是一个哲学上的概念,哲学上它指的是人类能够理解的抽象事物(这里理解可能会有些不合理的地方,欢迎大家指正),但是计算机领域的本体指的是一些概念,概念间的关系,公理,以及实例的集合,可以理解为本体就是人类对事物的形式化的描述。由于世间万物种类繁杂,所以描述不同的事物的本体会有区别。例如描述一个生物的本体和一个描述社会关系的本体显然不会相同,物以类聚,这样我们将描述同一类事物的本体的集合称为一个本体库。按照描述领域将本体库分类,可以将其分为通用本体库,领域本体库等。
本体的建立本体是用于对事物进行描述的,也是我们将知识传给计算机理解的一种方法,好的本体有着重要的意义,一般情况下建立本体需要遵循的原则有:
- 明确性和客观性:本体应该能够有效地说明所定义的术语的内涵。定义应该是客观的,与背景想独立的并且是形式化的,即能够通过机械的逻辑推理可以 表达。另外定义应该尽量完整。
- 自兼容性: 一个本体所定的应该与它所推导出的相一致,否则就会违背基本的推理逻辑。
- 可扩展性: 本体应该为可预料的任务提供概念基础,方便以后扩展。
- 奥卡姆剃刀原则,因不应超出果之所需,过度的设计会导致许多不必要的麻烦,本体应尽量简洁.
了解了本体的建立原则后,就是如何将本体具体的表示出来,现有的情况下是采用一些基于Web语义的本体语言XOL,RDF,OWL等.先抛开如何具体使用这些语言,先来看看本体需要描述那些东西,这些东西又该如何表示,首先根据本体的定义,可以得出:本体可定义为一个七元组O= {C,Ac,R,AR,H,I , X }.其中:
- C是概念的集合;
- Ac是概念属性的集合;
- R是关系的集合;
- AR是关系属性的集合;
- H是层次的集合;
- I是实例的集合;
- X是公理的集合。
按照这种思路很自然的公理,层次等可以用逻辑学中的语言形式化的描述出。例如公理表示为一系列的约束条件和推理规则结合。所有的这些如果形象的反应出来就是图。我们可以用图来描述一个本体。例如图1,生物的一些概念与概念间的关系可以用图描述出,图中的每个箭头代表了描述本体的一个关系(这里说声抱歉,这个图在生物学中是极其不准确的,这里只是为了说明一个概念.),每个节点代表着一个概念或者实例。

资源 资源可以视为一个对象,当然也可以视为一个概念(但是它只能描述概念的一部分)。它用于代表一个对象,它有一个标识符(URI).
属性 属性是一种特殊的资源,用于描述一个对象具有的某些特性,属性也有一个标识符.
陈述 陈述是一个三元组(a,p,b),用于表示a,b具有关系p.关系p同样具有一个标识符.
那么如何使用上述RDF的概念来表述本体的概念呢,通过比较RDF的概念与本体的概念不难发现RDF中的 资源与本体中的 概念,
RDF中的 陈述与本体中的 关系,RDF中的 属性与本体中的 属性以及层次有着相似的用途,这样本体的概念
可以通过RDF的概念来描述,也因此将本体这个抽象的概念具体化了。