
NLP
文章平均质量分 70
闪闪发亮的小星星
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
安装NLTK坑
tokenizer 包下面的 punkt 包要自己额外解压一下。经验: 要仔细看报错内容,不能直接百度。原创 2023-12-27 15:43:57 · 506 阅读 · 0 评论 -
How to Develop Word Embeddings in Python with Gensim
本教程分为 6 个部分;他们是:词嵌入Gensim 库开发 Word2Vec 嵌入可视化单词嵌入加载 Google 的 Word2Vec 嵌入加载斯坦福大学的 GloVe 嵌入。原创 2023-12-27 11:19:32 · 716 阅读 · 0 评论 -
How to Clean Text for Machine Learning with Python
本教程分为 6 个部分;弗朗茨·卡夫卡的《变形记》文本清理是特定于任务的 手动令牌化使用 NLTK 进行标记化和清理其他文本清理注意事项清理单词嵌入文本的提示。原创 2023-12-26 17:13:28 · 896 阅读 · 0 评论