
爬虫
白日梦想嘉
热爱的心,是日不落的国。
展开
-
爬取国家统计局区划代码(多进程版)
现在奉上多进程版本 from multiprocessing.pool import Pool from bs4 import BeautifulSoup import pandas as pd import requests import time import os headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ..原创 2020-09-18 08:43:43 · 692 阅读 · 0 评论 -
爬取国家统计局区域划分代码及名称
from bs4 import BeautifulSoup import pandas as pd import requests headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36'} 获取一级代码、名称、下一级链接 通过设置参数originUrl来调整爬...原创 2020-09-17 11:39:51 · 810 阅读 · 0 评论