命名实体识别《Named Entity Recognition using an HMM-based Chunk Tagger》

Motivation

命名实体识别(NER)是识别文本中基于特定意义的实体,例如人名、地名、机构名等。因为命名实体是信息抽取的关键步骤,而目前大多数的方法都是人为构造特征例如构造正则表达式。这种基于规则的NER方法只能用于某一种特定语言,其鲁棒性和迁移性较差。因此本文提出一种基于HMM的机器学习方法实现命名实体识别。

 

核心思想:

隐马尔可夫模型经常用于标注问题,这时状态对应着标记,标注问题是给定观测的序列预测其对应的标记序列。NER对应的数学公式表达为:

(1)

其中,是标记序列,也就是我们最终想获得的输出;,是观测序列即输入。为了简化计算,假设每个标记之间是独立的,所以第二项

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值