在爬取网站的时候都遇到过验证码,有什么方法可以让程序帮我们识别验证码呢?其实网上已有很多打码平台,但是这些都是需要money,像阿里云平台的,以前大概是每分钱1次,现在价格有点小贵,但对于仅仅爬取点数据而接入打码平台实属浪费。发现百度云上面有免费ocr正好可以利用,API也基本可以满足日常的使用,对于单个应用每天可以调500次,对于测试来说够了
登录至控制台,找到文字识别一栏
然后创建一个应用吧,系统会为你当前这个应用分配几个参数,这就是调用其API必须要使用的,在代码中会说到
在正式调用其接口之前,还是建议先大致阅读一下API文档,根据自己的业务需要选择适合自己的API接口使用
通常来说