多层级网页爬取并进行值传递,一定要用item去传,不然会传乱!!!!!!
爬取行政区划,按照省市县区街道的顺序保存记录。代码和效果图如下:
其他py文件就不再赘述了。数据库结果图如下:
694697条数据。运行时间1.5h
顺带爬了一下2018年的数据,687150条数据
8:34am ~10:58pm
多层级网页爬取并进行值传递,一定要用item去传,不然会传乱!!!!!!
爬取行政区划,按照省市县区街道的顺序保存记录。代码和效果图如下:
其他py文件就不再赘述了。数据库结果图如下:
694697条数据。运行时间1.5h
顺带爬了一下2018年的数据,687150条数据
8:34am ~10:58pm