【Python学习】网络爬虫-爬取豆瓣电影评论

一、实现目标

        编写一个爬虫,获取豆瓣网站上“庆余年 第二季”这部电视剧的短评,网站如下:

# https://movie.douban.com/subject/34937650/comments?sort=new_score&status=P #

二、实现步骤

        我们在 Google Chrome浏览器中复制粘贴下面的链接,先看看网页内容,打开网页后可以看到,《庆余年 第二季》这部电视剧的相关短评,就在标注的红色方框内。这就是我们今天要获取的内容。

        想要获取网页中的短评,首先要获取网页 HTML 代码,再把短评从中提取出来。

2.1 获取网页源码

        获取网页中的 HTML 代码,我们可以使用 requests 模块的 get 方法来实现。

# 使用import导入requests模块
import requests

# 将豆瓣电影评论URL地址,赋值给变量url
url = "https://movie.douban.co
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

西攻城狮北

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值