基于本体的文本信息提取:系统与应用
1 引言
基于本体的信息提取利用本体来形式化描述信息提取系统所使用的领域知识。本文将探讨本体在信息提取系统中的贡献,介绍不同类型的信息提取系统及其特点。
2 第三类信息提取系统
2.1 关系提取与专家反馈
关系提取是这类系统的常见任务。在一些对知识要求较高的领域,如哲学,会利用专家反馈来验证提取关系的有效性。
2.2 代表性系统
系统 | 输入与预处理 | 信息提取方法 | 本体使用 | 本体特征 | 输出 |
---|---|---|---|---|---|
OBIE | 原始、半结构化文本;分词、句子分割、词性标注、名词短语/动词短语分块、Bu - Chat/MiniPar解析器 | 机器学习 | 实体和关系标注 | 标注作为本体 | 关系提取 |
SYNDICATE | 原始文本;词性标注 | 机器学习 | 语言约束、关系验证 | KL - ONE | 本体填充、丰富 |
TEG | 原始 |