
自然语言处理
文章平均质量分 91
TangowL
这个作者很懒,什么都没留下…
展开
-
中文分词技术概要
中文自动分词,就是让计算机系统在中文文本中的词与词之间自动加上空格或者其他边界标记。原创 2017-09-17 11:41:43 · 621 阅读 · 2 评论 -
神经网络 和 NLP —— 结构化输出预测
不少内容在读 paper 时,已经深入了解过,这里就简单带过了,感兴趣的建议精读原书和参考文献吧。很多 NLP 任务设计结构化输出,即输出并非类标签或者类标签的概率,而是诸如序列、树、图等结构化的对象。经典任务有序列标注(pos)、序列分割(chunking、NER)、句法分析、MT 等。本文将介绍 NN 在结构化输出任务上的应用。1 基于搜索的结构化预测解决结构化预测最直接的思路就是即基...原创 2018-12-16 15:34:01 · 3278 阅读 · 1 评论 -
神经网络 和 NLP —— Cascaded, Multi-task and Semi-supervised Learning
当初入门 NLP 读的《Netural Network for Natural Language Processing》,收获颇丰。入门后,改成了读 paper 和 code,没有完整读完这本书,最近得空,把后几章补上,算是完整吧。不少内容在读 paper 时,已经深入了解过,这里就简单带过了,感兴趣的建议精读原书和参考文献吧。本文介绍串联学习、多任务学习、半监督学习。1 Cascaded...原创 2018-12-15 14:36:53 · 1401 阅读 · 0 评论 -
【精读Paper】BERT:NLP 新范式
二月份出了 ELMo,六月出了 OpenAI Transformer,十月又出了BERT,下半年开始的这场预训练语言模型的火,越燃越大啊,希望能烧出 CV 那样的 baseline。不得不说,Jacob 的这篇 BERT 真是大手笔,massive data + massive model + massive computation,踏平了 N 多 task,称得上 NLP 新范式了。当然,常人...原创 2018-10-16 00:30:53 · 3940 阅读 · 3 评论 -
中文(语音结果)的文本纠错综述 Chinese Spelling Check
中文的文本纠错,应用场景很多,诸如输入法纠错、输入预测、ASR 后纠错等等。这边简单梳理下对于这个任务的调研结果。原创 2018-09-24 12:29:28 · 18901 阅读 · 3 评论 -
从compositional到distributed,从无监督到有监督再到多任务学习 —— 漫谈句向量 Sentence Embedding
关于词向量,word embedding,研究相对较早,存在多种表征方式,目前 distributed 方式相对成熟,得到了广泛应用。但从 word 向 sentence、paragraph、document扩展,却仍处于探索阶段,本文尝试对目前主要的研究方向和代表工作进行概述,不会详细介绍模型细节,后续可能有文章继续跟进。...原创 2018-05-27 21:30:03 · 4282 阅读 · 0 评论 -
神经网络 和 NLP —— 神经网络入门
前段时间一口气读完了 NN4NLP,很是畅快,非常喜欢作者行文讲解的口吻和逻辑。大概两周读完,每页都有收获,读完后反而担心有所疏漏,知识太多留不住,索性从头来一遍,把学习过程的知识点和思考记录下来,也算精简版供自己今后查阅。 感兴趣的,可以一起学习讨论,真的很推荐这本书。大致介绍下该书。NN4NLP 由 Goldberg 撰写,是 CMU CS11-747 课程的教材,配合公开课食用更佳,公...原创 2018-02-26 22:33:41 · 4929 阅读 · 2 评论 -
神经网络 和 NLP —— CNN
前段时间一口气读完了 NN4NLP,很是畅快,非常喜欢作者行文讲解的口吻和逻辑。大概两周读完,每页都有收获,读完后反而担心有所疏漏,知识太多留不住,索性从头来一遍,把学习过程的知识点和思考记录下来,也算精简版供自己今后查阅。 感兴趣的,可以一起学习讨论,真的很推荐这本书。大致介绍下该书。NN4NLP 由 Goldberg 撰写,是 CMU CS11-747 课程的教材,配合公开课食用更佳,...原创 2018-03-14 00:21:53 · 1121 阅读 · 3 评论 -
神经网络 和 NLP —— 语言模型和词向量
前段时间一口气读完了 NN4NLP,很是畅快,非常喜欢作者行文讲解的口吻和逻辑。大概两周读完,每页都有收获,读完后反而担心有所疏漏,知识太多留不住,索性从头来一遍,把学习过程的知识点和思考记录下来,也算精简版供自己今后查阅。 感兴趣的,可以一起学习讨论,真的很推荐这本书。大致介绍下该书。NN4NLP 由 Goldberg 撰写,是 CMU CS11-747 课程的教材,配合公开课食用更佳,公...原创 2018-03-12 23:16:23 · 4327 阅读 · 3 评论 -
神经网络 和 NLP —— RNN
前段时间一口气读完了 NN4NLP,很是畅快,非常喜欢作者行文讲解的口吻和逻辑。大概两周读完,每页都有收获,读完后反而担心有所疏漏,知识太多留不住,索性从头来一遍,把学习过程的知识点和思考记录下来,也算精简版供自己今后查阅。 感兴趣的,可以一起学习讨论,真的很推荐这本书。大致介绍下该书。NN4NLP 由 Goldberg 撰写,是 CMU CS11-747 课程的教材,配合公开课食用更佳,...原创 2018-03-18 21:45:55 · 3989 阅读 · 1 评论 -
神经网络 和 NLP —— 文本中的特征构造
前段时间一口气读完了 NN4NLP,很是畅快,非常喜欢作者行文讲解的口吻和逻辑。大概两周读完,每页都有收获,读完后反而担心有所疏漏,知识太多留不住,索性从头来一遍,把学习过程的知识点和思考记录下来,也算精简版供自己今后查阅。 感兴趣的,可以一起学习讨论,真的很推荐这本书。大致介绍下该书。NN4NLP 由 Goldberg 撰写,是 CMU CS11-747 课程的教材,配合公开课食用更佳,公...原创 2018-03-04 00:09:27 · 2075 阅读 · 2 评论 -
文本匹配(语义相似度/行为相关性)技术综述
NLP 中,文本匹配技术,不像 MT、MRC、QA 等属于 end-to-end 型任务,通常以文本相似度计算、文本相关性计算的形式,在某应用系统中起核心支撑作用,比如搜索引擎、智能问答、知识检索、信息流推荐等。本篇将纵览文本匹配的技术发展,并重点介绍文本语义相似度计算技术,以及多轮对话场景中的文本语义相似度计算技术。原创 2019-01-13 13:08:39 · 33158 阅读 · 5 评论