关系抽取任务定义
实体间关系抽取的定义
Alexander Schutz等人认为关系抽取是自动识别由一对概念和联系这对概念的关系构成的相关三元组。
- Example1: 比尔盖茨是微软的CEO
- CEO(比尔盖茨, 微软)
- Example2: CMU坐落于匹兹堡
- Located-in(CMU, 匹兹堡)
- 高阶关系:Michael Jordan获得1997/98赛季的MVP
- Award(Michael Jordan, 1997/98赛季, MVP)
网络文本信息结构
结构化数据(Infobox)
- 置信度高
- 规模小
- 缺乏个性化的属性信息
半结构化数据
- 置信度较高
- 规模较大
- 个性化的信息
- 形式多样
- 含有噪声
纯文本