知识框架学习与融合
1.本体
本体通过对于概念(concept)、术语(terminology)及其相互关系(relation,property)的规范化(conceptualization)描述,勾画出某一领域的基本知识体系和描述语言。
- Conceptualization
1.Abstract model(concepts)
2.指某一概念系统所蕴含的语义结构,它是对某一事实结构的一组非正式的约束规则。它可以理解和/或表达为一组概念(如实体、属性、过程)及其定义和相互关系。 - Explicit
概念是被明确定义的。 - Formal
机器可读的 - Shared
Accepted by a group and not private to some individual.
Ontology vs. Knowledge Base
本体、知识库、知识图谱之间的关系
- Ontology:共享概念化的规范,涉及概念、关系和公理三个要素
- Knowledge:服从于ontology控制的知识单元的载体
2.Ontology Learning(Constructing Ontology)
- 手工构建Domain Ontology
- 自动构建
1.目前还不能直接使用
2.但是可以节省人力
构建本体的关键步骤包括:
1.Concept Extraction节点
2.Taxonomical relation extraction关系
3.No-taxonomical relation extraction属性
从半结构化(Semi-structured)数据中提取
从纯文本数据中提取(可使用术语提取工具)
3. Ontology Matching本体对齐
- 任务描述:
给定两个本体 o o o和 o ′ o^{'} o