MHGEE:基于多粒度异质图的事件提取模型
1. 事件提取概述
事件提取是信息提取的关键任务,通常包含事件检测和参数提取两个子任务。事件检测旨在识别和分类事件触发词,参数提取则是识别事件的参数并标注其角色。例如在特定文本中,事件检测要识别出触发词“dropped”以及事件类型“Conflict: Attack”,参数提取要识别出参数“U.S. planes”和“Iraqis”,并标注其角色为“Attacker”和“Victim”。
目前句子级事件提取面临两个关键挑战:
- 触发词歧义 :一个词在不同句子中可能表达不同含义,触发不同事件。如“dropped”在不同句子中可触发“Transport”或“Attack”事件,仅考虑单一粒度信息难以区分。
- 事件依赖 :一个句子可能同时表达多个相关事件,如“Three people plus the bomber were killed, and at least 30 others were hurt.”中,“killed”触发“Die”事件,“hurt”触发“Injure”事件。约27%的句子存在多个事件,且这些事件相互关联,有效建模它们之间的依赖关系是事件提取的关键挑战之一。
现有方法在解决这些挑战时存在不足。对于触发词歧义问题,多数方法仅考虑单一粒度信息,如实体类型或依赖树,无法有效解决歧义;部分使用文档粒度信息的方法会引入大量冗余信息,且忽视句子粒度信息。对于事件依赖问题,一些方法使用循环神经网络存在长距离依赖问题,基于图神经网络的方法仅考虑句子中的单词,忽视关键的多粒度信息和参数提取子任务。
为解决上述问题,提
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



