做文本处理的时候会用到哈工大LTP(Language Technology Platform),但是在Windows下python安装pyltp模块的时候遇到不少坑。首先放出LTP的依赖支持情况。来自 https://github.com/hit-scir/pyltp
可以看出在Windows下LTP不支持Python 3.7,目前只支持Python3.5和Python3.6。
在尝试过程中的问题归纳如下:
尝试1:pip install pyltp 很慢,后来改用豆瓣源安装 pip install pyltp -i https://pypi.douban.com/simple 。安装很快但是执行build的时候报错 “Microsoft Visual C++ 14.0 is required ... ” 提示的意思就是缺少依赖。
尝试2:求助 https://pypi.org/project/pyltp/ ,里面介绍了另外一种源码安装方式
$ git clone https://github.com/HIT-SCIR/pyltp
$ git submodule init
$ git submodule update
$ python setup.py install # Mac系统出现版本问题使用 MACOSX_DEPLOYMENT_TARGET=10.7 python setup.py install
这里要借助Git工具,在git bash命令行里输入按步骤输入以上命令。第三步执行很慢,执行到最后一步install的时候又报错
“Microsoft Visual C++ 14.0 is required ... ”
尝试3: 以上两种情形都需要先安装Microsoft Visual Studio(Microsoft BuildTools 2015无用)。苦于这个IDE太大,选择放弃。如果想避开安装 Microsoft VS, 从网友那得知有编译好的wheel文件可以通过pip install 的方式安装,但是只有适配 python3.5 和 python 3.6 的版本,即 pyltp-0.2.1-cp35-cp35m-win_amd64.whl 和 pyltp-0.2.1-cp36-cp36m-win_amd64.whl(详见 https://blog.youkuaiyun.com/shuihupo/article/details/81545335)。
本人电脑上是python 3.7,不想降级,于是借助Anaconda安装了python3.6,在Anaconda Prompt命令行窗口中敲入:
pip install pyltp
这样pyltp库就安装到Anaconda下的Python3.6环境下,安装成功,版本为最新的0.2.1。
关于LTP模型的下载及测试安装成功也与否也请参考 https://blog.youkuaiyun.com/shuihupo/article/details/81545335
这样,在Pycharm中编写代码调用pyltp的时候,可以配置项目文件夹的Interpreter为Anaconda环境下的python3.6环境。