【Python学习】网络爬虫-爬取豆瓣电影评论

西攻城狮北

已于 2024-06-09 23:44:23 修改

阅读量1.2w

点赞数 14

分类专栏： Python实用案例文章标签：学习 python 爬虫豆瓣评论

于 2024-06-09 15:04:59 首次发布

本文链接：https://blog.youkuaiyun.com/u014481728/article/details/139561757

版权

Python实用案例专栏收录该内容

41 篇文章 ¥19.90 ¥99.00

订阅专栏

一、实现目标

编写一个爬虫，获取豆瓣网站上“庆余年第二季”这部电视剧的短评，网站如下：

# https://movie.douban.com/subject/34937650/comments?sort=new_score&status=P #

二、实现步骤

我们在 Google Chrome浏览器中复制粘贴下面的链接，先看看网页内容，打开网页后可以看到，《庆余年第二季》这部电视剧的相关短评，就在标注的红色方框内。这就是我们今天要获取的内容。

想要获取网页中的短评，首先要获取网页 HTML 代码，再把短评从中提取出来。

2.1 获取网页源码

获取网页中的 HTML 代码，我们可以使用 requests 模块的 get 方法来实现。

# 使用import导入requests模块
import requests

# 将豆瓣电影评论URL地址，赋值给变量url
url = "https://movie.douban.co

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

西攻城狮北

关注关注

14
点赞
踩
78

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

订阅专栏

IDEA设置JDK版本和修改Maven工程运行环境的方法

AlianBlank的博客

08-17

1466

通过按照上述步骤进行操作，你可以灵活地切换不同的JDK版本，并且能够确保Maven项目使用相应的Java版本。在使用IDEA进行大数据项目开发时，常常需要设置特定的JDK版本和修改Maven工程的运行环境。在IDEA的右侧工具栏中，点击"Maven Projects"面板，展开你的项目，右键点击项目名称，选择"Reimport"选项，等待Maven重新导入项目并刷新依赖。至此，你已成功修改了Maven工程的运行环境。在IDEA中打开你的Maven项目，找到项目根目录下的pom.xml文件，并双击打开。

Mac 环境配置jdk、Maven

weixin_42416791的博客

08-25

3284

3、终端打开配置jdk时候建好的脚本文件： open -e .bash_profile。4、查看maven是否安装成功和系统能不能识别maven/mvn命令：⬇️。输入⬇️并保存：其中第一行JAVA_HOME替换为自己下的jdk路径。，安装编译好的二进制版本，具体安装zip还是tar.gz我看的。5、查看jdk是否安装成功和系统能不能识别java命令：⬇️。至此，我的Mac系统的环境配置jdk、Maven完成！然后就发现我的maven命令还是没作用，不识别，下载后直接安装即可，很快，点几下就OK了。

2 条评论您还未登录，请先登录后发表或查看评论

IDEA的配置JDK,Tomcat,Maven

lingmao555的博客

09-18

5383

IDEA的配置JDK,Tomcat,Maven，先下载安装jdk,其中JDK为安装版，tomcat，和maven为非安装版。JDK安装完成后要设置3个坏境变量，tomcat和maven好像不设置也行，就下载下来解压就行了。maven最好还是设置一下，有些用途在IDE中没法完成，必须要到命定行下面。本篇主要配置：先配置JDK，我的安装在C:\Program Files\Java\jdk1.8.0

idea更换jdk版本

m0_74036731的博客

03-30

3562

idea更换jdk的版本

idea下jdk和maven配置

WooHuPoself#5029的博客

06-28

1097

1.jdk安装 jdk1.8官网下载：https://www.oracle.com/java/technologies/javase/javase-jdk8-downloads.html 下载后直接双击运行，只点下一步就行，过程中有两个地方让选择安装路径，默认c盘就好，（这么一丁点能对c盘有什么影响，少花心思躺平就好） 2.jdk配置此电脑—>右键属性—>高级系统设置—>环境变量在系统变量里修改这三个： 1新建JAVA_HOME 变量名：JAVA_HOME 变量值：C:\Pr

idea配置jdk与maven

keerpt的博客

10-23

513

1、配置maven 当前项目配置maven 为以后项目设置maven 设置界面如下： 2、配置java

如何配置开发环境（JDK、Maven、IDEA)

Wxlxunxuan的博客

10-23

5218

验证安装：打开命令提示符或终端窗口，并运行以下命令来验证JDK是否正确安装：（1）.java -version （2）.javac -version。1.下载Maven:从Apache Maven官方网站下载最新版本的Maven。(2).在Maven home directory中选择你安装的Maven路径。(4).在“环境变量”窗口中，找到“系统变量”部分，点击“新建”按钮。(1).打开“控制面板” -> “系统和安全” -> “系统”。(6).找到“系统变量”中的“Path”变量，点击“编辑”按钮。

IDEA 设置JDK、Maven

qq_23021275的博客

01-05

742

JDK File—Project Structure—SDK 点击+sdk Maven File——Setting——Build,Exception,Deployment——Build Tools——maven

Tomcat安装教程：含JDK配置与IDEA打包解析

总结来说，安装和配置Tomcat涉及的关键点包括：确保先安装JDK，选择合适的安装方式，正确配置环境变量，以及理解IDEA中的Maven项目打包选项。了解这些基本操作后，开发者便能顺利地在本地环境中运行和测试Java Web...

maven的安装配置与idea基于maven构建项目

qq_46079450的博客

05-25

516

文章目录前言一、认识Maven目录结构二、Maven安装三、Maven设置本地仓库配置中央仓库镜像四、IDEA 中 Maven 的配置五、搭建基于 Maven 构建的 JavaSE 项目pom.xml 文件添加依赖六、搭建基于 Maven 构建的 JavaWeb 项目总结前言提示：maven项目的构建提示：以下是本篇文章正文内容，下面案例可供参考一、认识Maven maven是一个跨平台的项目管理工具，主要用作基于 Java 平台的项目（Maven 本身也是 Java 编写的）的构建、依赖包管

Java开发必知：JDK安装、环境变量配置与IDE内置机制全解析

最新发布

工一木子

04-29

810

1. JDK一定要有！即使IDE帮你管理了，它背后一定要有一份真正的JDK安装。2. 命令行开发，需要配置环境变量。否则无法直接使用javacjava等基本命令。3. IDE内部可以单独管理JDK。所以在IDE中开发，即使不配置环境变量也可以运行，但建议仍养成配置JAVA_HOME的好习惯，避免未来遇到复杂场景（如Maven、Gradle构建）出错。4. 注意JDK版本兼容问题。比如Java 8项目，用Java 17的JDK可能出现编译错误；需要针对项目指定正确的JDK版本。

【Java项目构建流程全解析】：IntelliJ IDEA中的Maven配置与调试

[【Java项目构建流程全解析】：IntelliJ IDEA中的Maven配置与调试](https://i0.wp.com/digitalvarys.com/wp-content/uploads/2019/11/image-1.png?fit=1024%2C363&ssl=1) # 摘要本文详细介绍了Java项目构建流程...

【开发工具】idea配置全局变量Jdk、maven仓库、maven（全文图解）

DreamSun的博客

03-16

6306

下图可以看到JDK已经在IDEA中配置好了。

IDEA中JDK的配置与Maven的配置详解

m0_53328194的博客

08-17

9992

1.在项目结构中配置JDK的版本。 2.在设置-构建-构建工具-Maven中配置Maven。 3.在设置-构建-构建工具-Maven-Importing中配置Maven的自动导入与JDK的版本(注意：Import Maven projects automatically项勾上)。

IDEA配置jdk,maven与tomcat

qq_40022860的博客

05-13

587

@[TOC] 文章目录所需要准备的软件及配置 JDK MySQL Maven idea tomcat 基础知识：环境变量配置：我的电脑-右键-“属性”-（左侧）高级系统设置-（弹窗右下角）环境变量配置-系统变量所需要准备的软件及配置软件准备序号软件名称 1 jdk 2 mysql 3 maven 4 idea 5 tomcat 1.jdk的安装与配置官网地址：https...

2024年Java常见面试题目，java集合框架面试

2401_84413490的博客

04-20

736

1.1 传统应用架构的问题1.2 微服务架构是什么1.3 微服务架构有哪些特点和挑战1.4 如何搭建微服务架构2.1 Spring Boot 是什么2.2 如何使用Spring Boot框架2.3 Spring Boot生产级特性3.1 Node.js 是什么3.2 如何使用 Node.js3.3 使用Node.js搭建微服务网关4.1 ZooKeeper 是什么4.2 如何使用 ZooKeeper4.3 实现服务注册组件4.4 实现服务发现组件5.1 Docker 是什么5.2 如何使用 Docker5.

IDEA配置Maven、配置JDK

weixin_45636446的博客

08-16

473

IDEA安装lombok插件、配置Maven、配置JDK 1、IDEA配置JDK 2、IDEA配置Maven

IDEA全局设置JDK、Maven、编码格式

weixin_44341110的博客

06-14

6475

IDEA全局设置java开发相关配置

IDEA 安装破解以及 jdk和maven配置

Phoenix_smf的博客

08-10

732

IDEA下载: http://www.jetbrains.com/idea/download/#section=windows 如图选择企业版本的根据自己的系统选择64位还是32位下载好后安装，破解码：打开连接 http://idea.lanyus.com/ 复制注册码即可破解，然后配置一下Maven file>右键setting> 这里设置一下Sett...