自然语言处理与机器学习入门
1. 自然语言处理相关库
在自然语言处理(NLP)领域,有许多实用的Python库,下面为大家介绍一些常见的库及其用途。
1.1 主流NLP库
| 库名 | 用途 |
|---|---|
| NLTK | 用于分词、词形还原、词干提取、解析、词性标注等几乎所有NLP任务。 |
| SpaCy | NLTK的主要竞争对手,可用于与NLTK相同的任务。 |
| Gensim | 用于主题和向量空间建模、文档相似度计算。 |
| Sklearn | 提供大量机器学习工具,也包含文本预处理工具。 |
| Pattern | 主要作为Web挖掘模块,NLP支持为次要功能。 |
| Polyglot | 不太流行,但可用于广泛的NLP任务。 |
1.2 示例代码及操作
下面以Gensim为例,展示如何调整代码参数并观察输出变化。
# 原代码中指定num_to
超级会员免费看
订阅专栏 解锁全文
8738

被折叠的 条评论
为什么被折叠?



