电影推荐—豆瓣电影排行榜数据抓取
目标网址:https://movie.douban.com/top250?start=
目标数据描述:(1)排名(2)电影名字 (3)链接 (4)导演人员 (5)评价 (6)评分 (7)评价人数 (8)评价内容
import requests
from bs4 import BeautifulSoup
import json
headers={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:58.0) Gecko/20100101 Firefox/58.0'}
#筛选信息
def get_top(url):
respose=requests.get(url,headers=headers)
soup=BeautifulSoup(respose.text,'lxml')
nums=soup.select('em')
titles=soup.find_all('div',class_='hd')</