Instance-Based Learning of Span Representations:A Case Study through Named Entity Recognition

该文提出了一种基于实例学习的命名实体识别(NER)模型,将NER问题转化为span分类任务,能处理嵌套实体。通过将实体和span映射到特征空间并计算相似度,确定span的标签概率。尽管模型简洁且有效,但其时间复杂度较高。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在这里插入图片描述

Abstract

本文提出了一个基于实例学习来学习span之间的相似度

Model

将NER问题形式化为span分类问题,可以处理嵌套实体
给定一个由T个单词的句子 X = ( w 1 , w 2 , . . . , w T ) X= (w_1,w_2,...,w_T) X=(w1,w2,...,wT),首先列举出可能的span S ( X ) \mathcal{S(X)} S(X),非实体span被分配为NULL标签
在这里插入图片描述
该模型的思想非常简单:将一个实体及其训练集的span映射到特征向量空间,然后计算相似度。
本文定义邻域span的概率为: P ( s j ∣ s i , D ) = e x p ( s c o r e ( s i , s j ) ) ∑ s k ∈ S ( D ) e x p ( s c o r e ( s i , s k ) ) P(s_j|s_i,\mathcal{D})=\frac{exp(score(s_i,s_j))} {\sum_{s_k\in \mathcal{S(D)}}exp(score(s_i,s_k))} P(sjsi,D)=skS(D)exp(score(si,sk))exp(score(si,sj))
score函数返回span s i , s j s_i,s_j si,sj的相似度,然后计算span s i s_i si被分配标签 y i y_i yi的概率:
P ( y i ∣ s i ) = ∑ s j ∈ S ( D , y i ) P ( s j ∣ s i , D ) P(y_i|s_i)=\sum_{s_j\in \mathcal{S(D,y_i)}}P(s_j|s_i,\mathcal{D}) P(yisi)=sjS(D,yi)P(sjsi,D)

启示

  1. 模型的思想比较简单,但是让我想我想不出来,作者牛皮,代码牛皮。唯一不足就是时间复杂度太高了,要考虑全部的span概率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

「已注销」

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值