NTN向量在答案评估中的应用
1. 实体关系提取
构建知识图谱需要大量的实体和关系三元组,这些三元组可用于学习潜在关系,发现实体间缺失的有效链接。这里使用两类实体关系:
- 从WordNet获取的语义关系。
- 从DT - Grade数据集定义和提取的表面关系。
在提取表面关系三元组时,假设给定智能辅导系统有有限数量的训练问题。实体可以是标记、文本块或问题的唯一标识号。具体操作步骤如下:
1. 标记实体获取 :对参考答案进行分词,仅保留名词、动词、副词和形容词等内容词作为实体。
2. 文本块获取 :使用SpaCy进行文本解析,从依赖解析树中获取文本块。
3. 其他实体和二元关系提取 :使用OLLIE工具提取其他类型的实体和二元关系。
依赖解析树除了提取短语外,还能提供实体间的句法关系。定义了以下五种关系类型:
1. is concept of :如果一个实体是问题的预期概念,问题是代表唯一标识号的抽象实体。
2. is constituent of :如果一个实体是另一个实体的组成部分。
3. has head text :根据依赖解析树,名词短语的中心词是另一个实体。
4. has ancestor text :根据依赖解析树,一个实体的祖先节点是另一个实体。
5. has child text </