
自然语言处理
文章平均质量分 61
一鸣鸣
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
命名实体识别系列(三)NER实体词典的获取与使用
一些网站会直接提供实体词典,如搜狗词典; 可以从结构化/半结构化数据中挖掘实体词典,例如百度百科、医学网站的Link等等; 从文本中挖掘。用户可能提供一些非标准化表达,这时候就需要用到新词挖掘技术,可以参考美团搜索的新词挖掘技术:...原创 2021-03-03 20:48:08 · 3096 阅读 · 3 评论 -
命名实体识别系列(二)NER技术选型
实际工作中往往不是直接训练某个NER模型,而是要先根据当前NER任务的特点进行技术选型,通常NER的识别技术为:规则抽取、实体词典匹配和模型预测基于规则的实体抽取:有些实体具有很强的模板(规则)性质,所以可以通过人工简单的配置一些模板规则就可以获得高准确率的实体抽取结果。例如结构化/半结构化数据中的实体抽取、利用某些特殊符号如书名号等等。 基于实体词典匹配的实体识别:实体词典是一种常用的资源,可以通过离线挖掘不断拓展。不断增加的新实体对实现高准确率、高覆盖率的NER带来了很大挑战,通过实体词典匹配的方原创 2021-03-01 19:47:31 · 776 阅读 · 0 评论 -
命名实体识别系列(一)NER任务介绍
命名实体识别系列(一)NER任务介绍前言博主为某校研究生,目前研二,经历过两段NER工作的实习,也投了一篇NER相关的论文。准备在今年(2021)开一个关于NER的系列博客,分专题由浅入深地从实践需求和学术论文等方面对NER做一个体系梳理。因个人能力和水平有限,并非该领域的资深专家,难免有不少疏漏和不妥甚至错误之处,恳请同行批评指正。注:以边学边做,边学边写的方法,对某些问题的理解会出现变化,因此所有文章都可能会随时更新调整。命名实体识别任务Q1:什么是命名实体识别?首先需要对任务的相关原创 2021-02-26 19:46:25 · 4757 阅读 · 1 评论 -
【关系抽取】Tensorflow实现基于Attention的PCNN以及ResCNN等(1)
本科毕业设计就是做关系抽取,准备采用远程监督数据集NYT数据集,使用Tensorflow实现几篇经典的论文,以及做一些改进和创新,本系列博客记录毕设全过程。经典PCNN论文:http://www.aclweb.org/anthology/D15-1203ResCNN论文:https://arxiv.org/pdf/1707.08866.pdf注意本ResCNN模型没有结合Attenti...原创 2019-03-19 16:42:07 · 3680 阅读 · 3 评论 -
Stanford CoreNLP结合Pyhton使用
详细参考https://blog.youkuaiyun.com/qq_35203425/article/details/80451243主要说一下Stanford CoreNLP工具可以处理分词、词性标注、句法分析等等功能,不需要下载那一堆分开的jar包,比如https://blog.youkuaiyun.com/zkq_1986/article/details/81583725里面提到的那一堆至于是否需要添...原创 2019-03-15 20:43:47 · 991 阅读 · 3 评论