本文按照自然语言处理的基本逻辑分类组织一批笔试面试常见问题,并给出最本质的核心回答。希望你能用keyword 抓住面试官的心。
本篇题集主要包括:
- 关系抽取
- 知识图谱
- 文本分类
关系抽取
关系抽取就是识别出实体和他们之间关系,最终构造出知识图谱来。
第一步先命名实体识别,抽取出相关实体。
第二步关系抽取,将实体对输入,并提取实体间的关系,具体可参考THU的开源代码OpenNRE
关系抽取可分为全局关系抽取与提及关系抽取。
- 全局关系抽取基于一个很大的语料库,抽取其中所有关系对;
- 而提及关系抽取,则是判断一句话中,一个实体对是否存在关系,存在哪种关系的工作。
关系抽取分两步,一步是判断一个实体对是否有关第,而另一步则是判断一个有关系的实体对之间的关系属于哪种。当然这两步可变成一步,即把无关系当作关系的一种(特殊的),来进行多类别分类。
- 搜索引擎是如何实现关联搜索的?
答:搜索引擎可能维护有一张巨大的由实体和关系组成的关系网络,能根据输入内容联想到相关信息。