自然语言处理复习
谨以此博客作为复习期间的记录
实体关系联合抽取
流水线式
-
流水线式抽取(Pipline): 把关系抽取的任务分为两个步骤,首先进行实体识别,再抽取出两个实体的关系。

-
联合抽取(Joint Extraction): 端到端,同时进行实体和关系的抽取。流水线式抽取会导致误差在各流程中传递和累加,而联合抽取的方式则实现难度更大
端到端方法

流水线式抽取和新标注策略的实体关系联合抽取都可以和序列标注结合起来,


检索式问答系统
流水线方式
Document Retriever 和 Document Reader 分两步
- Document Retriever:通过TF-IDF检索维基百科中与问题相关的Top K个文档
- Document Reader:将答案抽取转化为

本文回顾了自然语言处理中的实体关系联合抽取,强调了流水线式与端到端方法的差异,介绍了检索式问答系统中的DocumentRetriever和DocumentReader,探讨了基于证据强度和证据覆盖的重排策略,以及端到端Retriever-Reader模型和预训练Retriever-Free方法。同时涵盖了情感分析中的联合三元组抽取和序列生成问题处理。
最低0.47元/天 解锁文章
5181

被折叠的 条评论
为什么被折叠?



