Python机器学习及NLP库

本文介绍了多个机器学习及自然语言处理领域的常用工具,包括Scikit-Learn、Matplotlib、Statsmodels等,并详细列举了它们的主要用途,如分类、特征选择、支持向量机训练、主题建模等。

机器学习方面:

Scikit-Learn 可用于分类、特征选择、特征提取和聚集。还拥有自然语言处理特征提取的能力、词袋、tf-idf算法、预处理等。

Matplotlib 可以用于快速可视化。

Statsmodels 主要用于预测性和探索性分析。可以拟合线性模型,进行统计分析或预测性建模。

PyMC 做贝叶斯曲线的工具。

Shogun 主要用于支持向量机(SVM)

Gensim 用于主题建模,LDA及其变体等方面,支持自然语言处理

Orange 拥有图形界面的的库,能力比较平均。


NLP(自然语言处理)方面:

NLTK 《Python自然语言处理》一书的默认工具,提供WordNet这种方便处理词汇资源的接口,可用在分类、分词、词干提取、标注等任务。

Jieba 可用于分词、词性标注、特征词提取等方面。

Gensim 用于对大型语料库进行主题建模、文件索引、相似度检索等。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值