- 博客(6)
- 收藏
- 关注
原创 NLP-learning-5
Task 5 传统机器学习–朴素贝叶斯 朴素贝叶斯的原理 朴素贝叶斯应用场景 朴素贝叶斯优缺点 朴素贝叶斯 sklearn 参数学习 利用朴素贝叶斯模型结合 Tf-idf 算法进行文本分类 参考资料 朴素贝叶斯1:sklearn:朴素贝叶斯(naïve beyes) - 专注计算机体系结构 - 优快云博客 (https://blog.youkuaiyun.com/u013710265/article/d...
2019-04-15 20:30:44
242
原创 NLP-learning-4
Task 4 文本表示 TF-IDF原理。 文本矩阵化,使用词袋模型,以TF-IDF特征值为权重。(可以使用Python中TfidfTransformer库) 互信息的原理。 使用第二步生成的特征矩阵,利用互信息进行特征筛选。 参考资料 文本挖掘预处理之TF-IDF:文本挖掘预处理之TF-IDF - 刘建平Pinard - 博客园 (https://www.cnblogs.com/pinard...
2019-04-13 20:09:28
165
原创 NLP-learning-3
Task 3 特征提取 1. 基本文本处理技能 1.1 分词的概念(分词的正向最大、逆向最大、双向最大匹配法); 正向最大 如果叫成最长正向分词要更形象一些,是一种分治+贪婪的思想,并不一时处理全部串,而是分别处理预先设立长度的每一段,在每一段中求取最长的并且出现在字典里面的词。例如:abcdefabcdef,预先设立的最大长度为3。所以,先从串的开始截取长度为三的子串,即abcabc,如...
2019-04-11 21:08:55
216
原创 NLP-learning-1
之前安装好了anaconda pycharm util.py 用了很久的Jupyter Notebook Tensorflow安装时无法下载cuDNN,安装不了GPU版的
2019-04-07 16:44:54
115
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅