
spider
文章平均质量分 68
xiaofei_sun
不断学习,不断进步!知识就是力量!科技促进人类进步!
展开
-
爬虫框架简易安装执行步骤
scrapy项目流程创建一个scrapy项目:scrapy startproject XXXX #XXXX指为项目命名 生成一个爬虫:scrapy genspider XXXX项目名称 + 项目网址如(www.baidu.com),只要主域名即可 提取数据:完善spider,使用xpath等方法 保存数据:pipeline中保存数据创建scrapy项目安装...原创 2018-08-31 21:47:49 · 328 阅读 · 0 评论 -
Tesseract 安装和使用简介
Tesseract 教程介绍Tesseract 是一个 OCR 库,目前由 Google 赞助(Google 也是一家以 OCR 和机器学习技术闻名于世的公司)。Tesseract 是目前公认最优秀、最精确的开源 OCR 系统,除了极高的精确度,Tesseract 也具有很高的灵活性。它可以通过训练识别出任何字体,也可以识别出任何 Unicode 字符。安装Window 安装下...原创 2018-08-27 10:35:33 · 4304 阅读 · 0 评论