
NLP
B&&C
好记性不如烂笔头。
展开
-
NLTK安装、下载需要的语料(停用词)
一、安装nltk:pip install nltk二、下载需要的语料,以停用词为例>>> import nltk>>> nltk.download() # 会弹出窗口,自己选择下载注意:Searchedin的范围(可以用nltk.download('stopwords')直接下载,但是会下载到默认位置C盘)选择路径时,要在Sear...原创 2019-04-12 20:25:34 · 4130 阅读 · 2 评论 -
HanLP:pyhanlp安装成功之后,第一次使用出错——连接失败或者无此文件
使用命令`hanlp`来验证安装:C:\Users\Cab>hanlpDownloading http://file.hankcs.com/hanlp/data-for-1.7.3.zip to g:\developinstall\anaconda3\lib\site-packages\pyhanlp\static\data-for-1.7.3.zip1.68%, 10 MB, 3...原创 2019-05-10 17:07:45 · 4790 阅读 · 2 评论 -
HanLP:安装pyhanlp遇到的问题 Failed building wheel for jpype1
pip install pyhanlp报错: Failed building wheel for jpype1 error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual...原创 2019-05-10 15:18:22 · 6678 阅读 · 1 评论 -
HanLP:pyhanlp python中文分词,以及加入自定义词典
fw = open(HanLP_save_path, 'w', encoding='utf-8') # 分词结果保存with open(origin_path, 'r', encoding='utf-8') as fr: # 需要分词的文档 for line in fr: line = line.strip() word_list = HanLP...原创 2019-05-10 21:19:56 · 8737 阅读 · 5 评论