《Rethinking Boundaries: End-To-End Recognition of Discontinous Mentions with Pointer Networks》读后感
@苹果树科技有限公司-AI部
论文链接: https://www.aaai.org/AAAI21Papers/AAAI-566.FeiH.pdf
1. 导论
整个论文的目的是解决不连续的NER实体解析。

亮点在于:
1、使用了带memory的点网络(可以加强实体边界以及使用先验的实体)
2、模型做决定的时候能使用全局信息
2. 模型架构
2.1 方法概述
整个非连续的NER任务可以使用下面式子来进行描述:
输入: s = {w1, w2, …, wn},n表示句子中字符的个数。
输出:Y = {y1, y2, …, ym},yk=[a, …, b]表示一个实体按顺序排列的索引。(1<=a<=b<=n,论文中表示a<b,感觉这里有问题,因为如果单个字符就表示一个实体呢)
2.2 模型整体架构

加入了两个哨兵字符:<EOM>和<NEXT>
解码的过程:

该论文提出了一种新的方法,利用memory-augmented的Pointer网络来处理不连续的命名实体识别(NER)问题。模型通过Transformer结构对输入进行特征提取,并引入哨兵字符改善解码过程。在训练阶段,采用Teacher Forcing和Dynamic Sampling策略,逐步从依赖标准答案转向依赖预测结果,以提高训练和推理的一致性。这种方法强化了实体边界识别并利用了先验实体信息。
最低0.47元/天 解锁文章
338

被折叠的 条评论
为什么被折叠?



