Python爬虫：urllib_ajax的get请求豆瓣电影第一页(07)

最新推荐文章于 2026-01-08 23:29:03 发布

原创最新推荐文章于 2026-01-08 23:29:03 发布 · 153 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #爬虫 #ajax

python爬虫知识小仓库专栏收录该内容

8 篇文章

订阅专栏

Python3.8

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

# get请求
# 获取豆瓣电影的第一页数据 并且保存起来

import urllib.request

url = 'https://movie.douban.com/j/chart/top_list?type=5&interval_id=100%3A90&action=&start=0&limit=20'

headers = {
    'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/130.0.0.0 Safari/537.36'
}

#（1）请求对象的定制
request = urllib.request.Request(url=url, headers=headers)

#（2）获取响应的数据

response = urllib.request.urlopen(request)

content = response.readline().decode('utf-8')


#（3）下载数据到本地

#第一种写入方法
# fp = open('douban.json', 'w', encoding='utf-8')
# fp.write(content)

#第二种写入方法

with open('douban.json', 'w', encoding='utf-8') as fp:
    fp.write(content)

这个其实就是爬虫入门的爬取豆瓣网页的基本框架了，这个很是需要作为一个经典的参考价值

您可能感兴趣的与本文相关的镜像

Python3.8

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本