今天继续来写pynlpir分词库的后续pynlpir.nlpir(以下简称nlpir)。nlpir比pynlpir的功能相似,更易于使用,下面开始介绍。
初始化
pynlpir.nlpir.Init(data_dir, encoding=GBK_CODE, license_code=None)
使用Init方法初始化函数。
- data_dir(str) - NLPIR数据文件夹的父文件夹的路径。 PACKAGE_DIR可用于此目的。
- encoding(int) - NLPIR应该期望的编码。 此参数应使用GBK_CODE,UTF8_CODE,BIG5_CODE和GBK_FANTI_CODE。
- license_code(str) - 无限使用的许可证代码。大多数用户不需要使用它。
需要说明的是,在我自己运行的代码中,发现如下问题:
from pynlpir import nlpir
d = '大使馆