人名识别
Mynlp的人名识别是基于结构化感知机、序列标注模型的实现。独特之处在于特征函数和Label的设计和其他NLP工具的差别。
该人名识别算法是基于字符输入的,也就是说不需要预先分词,直接从文本中提取人名,
天然具有歧义识别。在PKU数据集上,最终F1达94.91,如果剔除古汉语人名的影响,F1可以更高。
Mynlp项目地址:
https://github.com/mayabot/mynlp
调用非常简单
<dependency>
<groupId>com.mayabot.mynlp</groupId>
<artifactId>

Mynlp采用结构化感知机和序列标注模型进行人名识别,无需预先分词,能从文本中直接提取并识别歧义。在PKU数据集上,未考虑古汉语人名时,F1分数高达94.91。项目源码可在GitHub找到,调用简便,模型大小11.5M,内存占用45M。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



