
人工智能
文章平均质量分 82
爱分享的淘金达人
http://www.jhzjz.cn/
展开
-
win7,64位系统安装Tesseract和pytesseract,用python轻松实现中文识别,超全攻略!
OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程。Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进,消除bug,优化,重新发布。当前版本为4.0step1:安装tesseract从官网下载这个文件:tesser转载 2017-12-19 11:13:33 · 4474 阅读 · 0 评论 -
电商产品评论数据情感分析代码详解
本章代码建议在linux下面运行,windows下安装gensim会比较麻烦。我是在python3.5.2的pycharm下运行的下面代码的意思是从评论数据中抽取品牌是美的的数据(15-1)[python] view plain copy #-*-coding:utf-8-*-importpandasaspdinput原创 2018-01-30 11:33:30 · 10501 阅读 · 4 评论