前言
利用Python实现奥斯卡金像奖数据可视化。废话不多说。
让我们愉快地开始吧~
开发工具
Python版本: 3.6.4
相关模块:
requests模块
pandas模块
pyecharts模块;
以及一些Python自带的模块。
环境搭建
安装Python并添加到环境变量,pip安装需要的相关模块即可。
分析网页
奥斯卡的相关数据获取,来源于Mtime时光网。
网站没反爬,所以可以轻松获取到数据。
这里以最佳男主角为例,获取时间、获奖者及提名者。
通过一个循环,将最佳男主角、男配角、女主角、女配角信息拿到手。
获取数据
时间、获奖者及提名者信息获取代码如下。
import time
import requests
from bs4 import BeautifulSoup
filenames = ['Best_Actor_LR.csv', 'Best_Actress_LR.csv', 'Best_Actor_SR.csv', 'Best_Actress_SR.csv']
def get_message(num1, num2):
"""获取数据"""
time.sleep(5)
years, wins, nominations = [[], [], []]
# 请求网址
url = 'http://award.mtime.com/3/award/3' + str(num1) + '/index' + str(num2) + '.html'
headers =