项目场景:
基于2019年网络数据,通过网页爬虫获取、整理并可视化数据。
项目简介
首先,利用 Selenium 库和 Chrome 浏览器驱动程序获取了指定网页的特定元素内容;然后,利用 BeautifulSoup 库解析 HTML 内容,并提取出其中的表格数据;接着,利用 Matplotlib 库绘制了一个饼状图,展示了新冠肺炎在各国的占比情况,并将该图保存为 jpg 格式的图片;最后,使用 imageio 库将这些图片制作成了一个 GIF 动图,并保存在指定的路径下。
代码整体流程:获取网页内容 -> 解析表格数据 -> 绘制饼状图 -> 保存饼状图为图片 -> 制作 GIF 动图。
代码实现:
from selenium import webdriver
driver=webdriver.Chrome()
url="https://voice.baidu.com/act/newpneumonia/newpneumonia/?from=osari_pc_3#tab4"
xpath1="/html/body/div[2]/div/div/div/section/div[2]/div[3]/div[2]/div[11]/table/tbody/tr/td/table/tbody"
driver.get(url)
table1=driver.find_element_by_xpath(xpath1).get_attribute('innerHTML')
from bs4 import BeautifulSoup
soup=BeautifulSoup(table1,"html.parser")
table2=soup.find_all('tr