# get请求
# 获取豆瓣电影的第一页数据 并且保存起来
import urllib.request
url = 'https://movie.douban.com/j/chart/top_list?type=5&interval_id=100%3A90&action=&start=0&limit=20'
headers = {
'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/130.0.0.0 Safari/537.36'
}
#(1)请求对象的定制
request = urllib.request.Request(url=url, headers=headers)
#(2)获取响应的数据
response = urllib.request.urlopen(request)
content = response.readline().decode('utf-8')
#(3)下载数据到本地
#第一种写入方法
# fp = open('douban.json', 'w', encoding='utf-8')
# fp.write(content)
#第二种写入方法
with open('douban.json', 'w', encoding='utf-8') as fp:
fp.write(content)
这个其实就是爬虫入门的爬取豆瓣网页的基本框架了,这个很是需要作为一个经典的参考价值
433

被折叠的 条评论
为什么被折叠?



