
自然语言处理
文章平均质量分 90
zerozzl01
这个作者很懒,什么都没留下…
展开
-
机器阅读理解学习笔记
================================================================================================ACL 2018:Simple and Effective Multi-Paragraph Reading Comprehension=========================================================================================原创 2021-10-16 15:19:36 · 751 阅读 · 0 评论 -
文本分类学习笔记
1 文本分类概述1.1 简介文本分类。3 论文笔记================================================================================================ACL 2017:Bag of Tricks for Efficient Text Classification==================================================================.原创 2021-10-05 15:48:00 · 480 阅读 · 0 评论 -
词性标注学习笔记
1 词性标注概述1.1 简介词性(Par-Of-Speech,Pos)是词汇基本的语法属性,通常也称为词类。词性标注就是在给定句子中判定每个词的语法范畴,确定其词性并加以标注的过程。1.2 难点1)汉语是一种缺乏词形态变化的语言,词的类别不能像印欧语那样,直接从词的形态变化上来判别。2)常用词兼类现象严重,具有多个词性的兼类词的占比高达22.5%。而且越是常用的词,多词性的现象越严重。3)词性划分标准不统一。词类划分粒度和标记符号等,目前还没有一个广泛认可的统一的标准。比如LDC标注原创 2021-09-17 16:56:01 · 2552 阅读 · 0 评论 -
命名实体识别学习笔记
================================================================================================ACL 2017:Fast and Accurate Entity Recognition with Iterated Dilated Convolutions=============================================================================原创 2021-08-14 10:48:23 · 2104 阅读 · 0 评论 -
开放领域问答学习笔记
1 开放领域问答概述1.1 简介开放领域问答(Open-domain question answer, QA),即使用大量不同主题的文档来回答问题,是自然语言处理(NLP)、信息检索(IR)和相关领域长期研究的主题。传统的QA系统通常构建为一个pipeline,由许多不同的组件组成,如问题处理、文档/文章检索和答案处理。随着深度学习的快速发展,现代开放域QA系统通过结合传统IR技术和深度学习模型重构,甚至完全以端到端方式实现。1.2技术方案当前开放域问答的技术方案可以主要分为三大类:..原创 2021-08-31 18:22:38 · 3449 阅读 · 0 评论 -
对话状态跟踪学习笔记
================================================================================================ACL 2019:Transferable Multi-Domain State Generator for Task-Oriented Dialogue Systems=======================================================================原创 2021-01-30 15:37:14 · 4574 阅读 · 0 评论 -
实体关系抽取学习笔记
1 关系抽取概述1.1 简介关系抽取可分为全局关系抽取与提及关系抽取。全局关系抽取基于一个很大的语料库,抽取其中所有关系对,而提及关系抽取,则是判断一句话中,一个实体对是否存在关系,存在哪种关系的工作。常见的关系抽取结果可以用SPO结构的三元组来表示,即 (Subject, Predication, Object),如:中国的首都是北京 ==> (中国, 首都, 北京)关系抽取的分类:是否有确定的关系集合:限定关系抽取:事先确定好所有需要抽取的关系集合,则可讲关系抽取看作是一中原创 2020-12-08 18:26:13 · 4365 阅读 · 0 评论 -
NLP文本输出评价方法
BLEU:找出输出句子与参考句子之间的 n 元语法重叠部分并对(比参考句子)更短的输出句子施以惩罚的评价方法NIST:它基于 n 元语法的稀缺性对其进行加权。这就意味着对某个稀缺 n 元语法的正确匹配能提高的分数,要多于对某个常见的 n 元语法的正确匹配。(http://www.mt-archive.info/HLT-2002-Doddington.pdf)ROUGE:它对 BLEU 进行...原创 2020-01-21 16:01:54 · 1401 阅读 · 0 评论