
NLP
KODGV
这个作者很懒,什么都没留下…
展开
-
NLP术语
不定期更新(我的理解可能会有误差,若有错误还望大神赐教)词向量矩阵(非词汇表向量):word vector matrix/look-up table词向量:word vector/word embedding/word representation语料库: corpus归一化:Normalization将一系列的单词 转化成 某种 统一 的形式,比如:将一句话的各个单词中,有大写、有...原创 2019-01-07 10:42:36 · 274 阅读 · 0 评论 -
论文阅读:Neural Relation Extraction with Selective Attention over Instances
摘要现存问题:远程监督会出现一些错误标注的问题解决方法:使用卷积神经网络映射句子语义,使用attention机制减少噪声 数据的权重。实验证明和意义:模型可以利用句子的所有信息,并且减少错误样本的影响。介绍现状:针对KB,现有实体跟现实世界的实体差很远很远。因此自动的关系抽取很重要(因为可以不依赖现有实体去做)。介绍他人工作:目前大多数关系抽取都是基于大量的人工标注...原创 2019-02-06 19:42:26 · 588 阅读 · 0 评论 -
缺乏标注语料下如何实体识别
最近有知识图谱的任务,要做实体识别。才发现实体识别的坑在于公开数据集只标注了人名机构名地点,但是知识图谱的需求一般都是针对垂直领域。即需要识别出数据库字段对应特定的实体,然而有些领域的实体标注会很麻烦,一个是没有足够的语料,一个是非专家可能会标错。因此找了一个无监督生成实体的方法。https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3865922/其核心...原创 2019-02-27 14:52:40 · 2323 阅读 · 3 评论 -
OpenNER关系抽取代码阅读
继上文阅读了论文Neural Relation Extraction with Selective Attention over Instances后,就找源码来修修改改以完成关系抽取的任务。论文源码是C++实现,在其github上面找到另一个整合了几篇论文更好的框架OpenNER遇到的坑no module named framework这不是少包,这是包在目录下没找到,只需要在impor...原创 2019-02-11 20:42:29 · 3589 阅读 · 5 评论 -
tensorflow的学习文章
RNN正确打开方式转载 2019-03-05 20:16:38 · 142 阅读 · 0 评论 -
NLP的文章
CRF条件转移场BERT转载 2019-03-06 19:48:30 · 171 阅读 · 0 评论