医疗文本的规范化

Adapting Phrase-based Machine Translation to Normalise Medical Terms in Social Media Messages

health reports in social media, such as DailyStrength and Twitter, have potential (数据来源)

然而,为了使机器理解并推断用户的健康状况,需要能够识别口语化术语何时涉及特定的医学概念(即文本标准化)。

Moreover, we propose to combine the adapted phrase-based MT technique and the similarity between word vector representations to effectively map a Twitter phrase to a medical concept.

我们提出两种技术来解决这个问题。 对于第一种技术,我们基于phrm的向量表示与每个概念descc的描述的向量表示之间的余弦相似性对目标概念进行排名:

实际上,第二种技术计算相似度得分如下:

MT如下:

整个模型

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值