最近身边一直有朋友说用Selenium无法爬取淘宝的商品数据了,问问有没有其他的爬取方式,来获取淘宝的商品数据。方法当然有了,下面我就给大家介绍一个Requests+Cookie来获取淘宝数据的方法,这里我把这种方式获取淘宝商品详情封装成了API接口的形式,需要大量批量获取淘宝商品详情的朋友,可以直接注册KEY免费调用测试。
构造URL
我们进入到淘宝商品数据页面,按F12打开开发者模式,对页面进行观察,我们发现淘宝页面是Ajax方式加载的,而且它的接口参数很复杂且没有固定的规律,但是Selenium又被淘宝反爬限制了,所以我们不能使用Ajax来获取商品数据。
在这时,我突然发现页面的数据在源网页里面存放着。如图: