我是从首页开始爬取的,首先就是获取京东首页里的商品类别的链接,我这里就讲我在获取链接中遇到的问题
1、京东商品类的链接是动态加载的,所以不能直接爬取。需要调取网页调试工具,然后切换到network窗口,然后再搜索框中输入:list.jd.com,就可以很幸运的获得动态链接的地址,动态链接是json数据格式。
2、在解析动态链接过程中,json数据中包含有list的格式,是京东把子类别以字典的形式存放。以下是解析json数据的代码。
我是从首页开始爬取的,首先就是获取京东首页里的商品类别的链接,我这里就讲我在获取链接中遇到的问题
1、京东商品类的链接是动态加载的,所以不能直接爬取。需要调取网页调试工具,然后切换到network窗口,然后再搜索框中输入:list.jd.com,就可以很幸运的获得动态链接的地址,动态链接是json数据格式。
2、在解析动态链接过程中,json数据中包含有list的格式,是京东把子类别以字典的形式存放。以下是解析json数据的代码。