
NLP
小乖的晴天
这个作者很懒,什么都没留下…
展开
-
windows下安装tesserocr报错及解决办法——下载whl安装包
一开始参考《Python3网络爬虫开发实战教程》进行安装,后来遇到一些小问题,现在将安装过程,遇到的问题以及解决方法总结一下: 在Windows下安装tessocr,首先需要下载tesseract,它为tesserocr提供了支持。tesseract下载地址:https://digi.bib.uni-mannheim.de/tesseract/进入下载页面,可以看到有各种.exe文...原创 2018-08-22 16:02:46 · 7496 阅读 · 5 评论 -
《Python自然语言处理》学习笔记
1.3计算语言:简单的统计 频率分布如何统计一篇文章中词频,使用下列语句即可实现,因为书中使用的python2,笔者在用python3时遇到一些小问题,蓝色小字给出了解决方案。 实际操作过程: 这个语句可以画出text1中50个最常用词的累计频率图 还可以设置一定条件,进行搜索 词语搭配和双连词找到比我们基于单个词的频率预...原创 2018-09-13 17:58:58 · 280 阅读 · 0 评论