
NLP
T.O.P_KING
这个作者很懒,什么都没留下…
展开
-
1.自然语言处理(NLP)与Python
自然语言工具包(NLTK) nltk入门翻译 2016-12-28 16:36:23 · 7130 阅读 · 0 评论 -
2.NLTK之文本语料库
就职演说语料库 该语料库是 55 个文本的集合,每个文本都是一个总统的演说。这 个集合的一个有趣特性是它的时间维度:>>> from nltk.corpus import原创 2016-12-29 22:19:26 · 4045 阅读 · 0 评论 -
3.NLTK之加工原料文本
从网络和硬盘访问文本 电子书原创 2017-01-06 23:45:47 · 779 阅读 · 0 评论 -
4.NLTK之编写结构化程序
回归基础赋值赋值似乎是最基本的编程概念,不值得单独讨论。不过,也有一些令人吃惊的微妙之处 。思考下面的代码片段:>>> foo = 'Monty'>>> bar = foo >>> foo = 'Python' >>> bar'Monty'由于bar是foo的一个副本,所以改变foo时,bar不会受到影响。 然而,赋值语句并不总是以这种方式复制副本。特别是结构化对象的“值”,例如一个链表,原创 2017-01-09 20:30:21 · 503 阅读 · 0 评论 -
5.NLTK之分类和标注词汇
本章关注的问题: 1. 什么是lexical categories(词汇分类),在NLP中如何使用它们? 2. 什么样的Python数据结构适合存储词汇与它们的类别? 3. 如何自动标注文本中词汇的词类?原创 2017-01-11 21:07:13 · 6522 阅读 · 0 评论 -
6.NLTK之学习文本分类
有监督分类(Supervised Classification)如果分类的建立基于包含每个输入的正确标签的训练语料,被称为有监督分类。原创 2017-02-28 21:15:57 · 3402 阅读 · 0 评论 -
7.NLTK之从文本提取信息
信息提取(Information Extraction)下图显示了一个简单的信息提取系统的结构。 首先,使用句子分割器将文档的原始文本分割成句,使用分词器将每个句子进一步细分为词。接下来,对每个句子进行词性标注,在下一步,命名实体识别中我们将寻找句子中提到的实体;最后,使用关系识别搜索文本中不同实体间的可能关系。原创 2017-03-02 21:06:34 · 2974 阅读 · 0 评论 -
8.NLTK之分析句子结构
学习文法的好处学习文法的一个好处是,它提供了一个概念性的框架和词汇拼写这些直觉。原创 2017-03-07 18:17:15 · 8531 阅读 · 0 评论