Python爬取国家统计局数据并做简单的数据缺失值处理！

人口数据爬取

最新推荐文章于 2025-08-29 00:43:13 发布

原创

最新推荐文章于 2025-08-29 00:43:13 发布 · 938 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#列表 #python #数据分析 #html #selenium

准备工作：需要先安装chrome浏览器

其次，下载chromedriver驱动，下载方式可点击这里，下载完毕放置的位置没有要求，只需要在下面的代码中将地址改成你的chromedriver驱动放置的位置就可以啦。

PS：如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

python免费学习资料以及群交流解答点击即可加入

爬虫代码如下：

# -*- codeing = utf-8 -*-
# Datatime:2020/12/5 5:04
# Filename:text3 .py
# Toolby: PyCharm


import time
import ssl
import xlwt
from selenium import webdriver
from bs4 import BeautifulSoup
ssl._create_default_https_context = ssl._create_unverified_context

#爬取网页，得到数据
def getData():
    chrome_driver = "D:\Google\chromedriver_win32\chromedriver.exe"     #chromedriver驱动文件的位置

    browser = webdriver.ChromeOptions()
    browser.add_argument('user-agent=Mozilla / 5.0(Windows NT 10.0;Win64;x64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 87.0.4280.66 Safari / 537.36')
    browser.add_argument('--ignore-certificate-errors')

    ss = webdriver.Chrome(executable_path=chrome_driver,chrome_options=browser)
    ss.get('https://data.stats.gov.cn/easyquery.htm?cn=C01')

    time.sleep(30)                                   #睡眠3秒，等待页面加载