语义类与相关领域在词义消歧中的应用及匈牙利语转录本的MLU估计方法
1. 词义消歧中的语义类与相关领域
词义消歧(WSD)是自然语言处理中的一个具有挑战性的问题。语义类是将具有共同属性、特征和意义的子概念和词义分组的概念,例如“VEHICLE(交通工具)”包含“car(汽车)”“helicopter(直升机)”等子概念,“BUILDING(建筑物)”包含“school(学校)”“church(教堂)”等子概念。
1.1 研究现状
许多研究人员致力于开发高效的WSD系统,但自20世纪50年代末首次提出歧义问题以来,WSD一直是一个难题,且进展缓慢。为解决词义过于精细的问题,出现了多种方法:
- 一些研究致力于推导不同的词义分组,以克服WordNet中词义的细粒度描述,但这些方法仅尝试对同一单词的词义进行分组,仅利用了多义词减少的优势。
- 部分研究与本文方法类似,专注于使用预定义的语义类来学习基于类的WSD分类器,多数方法使用WordNet的词典文件(即SuperSenses)作为粗粒度的词义区分,但对从其他可用词义分组中学习基于类的分类器的关注较少。
- 在无监督方法中,也有使用语义类而非词义来开发WSD系统的情况,例如研究意义与领域之间的关系。
1.2 语义资源
语义资源可分为语义类和领域两类:
- 语义类 :是包含具有共同特征的其他概念的概念,概念与子概念之间的关系用“is - a”表示,如“car is - a vehicle”。本文使用了从WordNet派生的两种语义类:基本层次概念(BLC)和SuperSenses。BLC是在尽可能表示更多概念和
超级会员免费看
订阅专栏 解锁全文
36

被折叠的 条评论
为什么被折叠?



