最近几天在学python爬虫,需要用到tesserocr,然后各种找教程下载,感觉好多教程讲的都有点和自己的对不上,现在分享下自己安装的经验。
网上说要先装tesserocr,就要先装tesseract这个,通过这个安装,我也不知道对tesserocr的安装有啥用,就跟着安装了。
我的python是3.7版本的。
1.首先是安装tesseract
安装的是这个
https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-v4.0.0-beta.4.20180912.exe
这个要√,是安装多个国家语言的。然后安装还比较快。
然后是说要配置相应的环境变量
参考这个
https://blog.youkuaiyun.com/qq_41895190/article/details/82696550
2.安装tesserocr
(1)win+r 然后cmd确认 ,打开命令行,先输入python
(2)
AMD64输入
import pip._internal
print(pip._internal.pep425tags.get_supported())
WIN32输入
import pip
print(pip.pep425tags.get_supported())
通过第一个括号里的确定下载tesserocr的版本,我这个是cp37,cp37m,win32。
(3)
https://github.com/simonflueckiger/tesserocr-windows_build/releases
下载对应的whl,
我的是tesserocr-2.3.1-cp37-cp37m-win32.whl这个版本的。(下载可能有点慢,虽然只有2~3M)
(4)
最后接着打开命令行,最好以管理员身份打开(右键左下角的win菜单,上面有),不然可能会出现错误,接着到你下载到的这个whl文件的位置,我下载在E盘的pycharm里。
然后运行代码:
pip install tesserocr-2.3.1-cp37-cp37m-win32.whl
就会显示安装成功啦。(安装成功的图没截图就没有了。反正大体是安装成功了。)
(5)
检查是否安装成功的话,就打开命令行输入python,然后import tesserocr随便运行一个试试就行了。
3.配置pycharm里的tesserocr
可以直接File -> settings -> project -> project interpreter -> 里就有了,也就是pycharm里的解析器。
不会的可以参考这个
https://www.crifan.com/pycharm_correct_set_python_interpreter_current_can_detect_import_libs/