
NLP
自然语言处理基本操作
leukocyten
小白,学习,积累
展开
-
深度学习与自然语言处理(一)(台大2016慕课)
目录机器学习概念机器学习步骤机器学习分类监督学习与强化学习 机器学习概念 机器学习可以简单理解为找一个功能适用的函数 机器学习步骤 找一个函数集合 用集合中的函数计算测试数据,并显示结果数据 选取一个函数用以选取集合中效果最好的函数(以后用func指代) 机器学习分类 Regression:func的输出结果为数值 Classification:又分为二分类和多分类(二分类指func输出结果为两种结果之一(例如:是或不是),多分类输出结果则分为多类) Structured Learning:fu原创 2021-04-17 15:50:30 · 204 阅读 · 0 评论 -
2021-04-02
NLTK包的使用 词频统计 NLTK生成的结果为频数字典 #导入nltk import nltk #导入分词工具 将文本分成单个词 from nltk.tokenize import word_tokenize work_list = word_tokenize(text) #text为要分词的文本 fre = nltk.FreqDist(word_list) #统计所有分词的词频 返回结果是一个频数字典 fre.keys() #列出分词列表 统计出频数最高的前10个词(有两种形式) fre.tabula原创 2021-04-02 14:16:27 · 78 阅读 · 0 评论