27、孟加拉语事实问答系统与基于字典的问题短语提取

孟加拉语事实问答系统与基于字典的问题短语提取

一、孟加拉语事实问答系统(BFQA)

1.1 相似度度量

在相似度度量中,仅考虑词性(POS):动词(VB)、名词(NN)、形容词(ADJ)和专有名词(NE)。为动词、名词、形容词和命名实体分别定义了四个权重 λvb、λnn、λadj 和 λne,设置 λvb = 0.2,λnp = 0.3,λadj = 0.1,λne = 0.4,使得四个权重之和为 1,即 $\sum_{Pos\in{vb,np,adj,ne}} \lambda_{Pos} = 1$。

自然语言问题 Qt 和句子 Sl 的相似度计算公式为:$Similarity(Q_t,S_l) = \sum_{K=1}^{n} frequency_{Q.wK}$,其中 $w_K = Q(\lambda_{Pos})$,$frequency_Q$ 是问题词 Q 在句子 Sl 中的出现次数。

1.2 名称比例(nprop)

使用 Jaccard 相似度系数来衡量名称比例。在名称比例度量中,它被定义为问题和句子中命名实体交集的大小除以问题和句子中命名实体并集的大小。

1.3 段落相关性

段落与问题的相关性通过计算段落中查询词的存在情况来衡量,同时也考虑查询词的同义词。为每个出现的词分配相关性权重:
- 若原始查询词出现在段落中,相关性权重(rw)为 1.0;
- 若同义词出现在段落中,相关性权重为 0.9;
- 若既没有查询词也没有同义词,相关性权重为 0.0。

单词的段落相关性计算公式为:$R_w = frequency\times rw =

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值