爬取数据保存至mysql数据库

本文介绍了一种将网页抓取的数据保存至MySQL数据库的方法。通过一个具体案例展示了如何使用Python进行网页爬取,并根据不同类型的链接采取不同的处理方式。特别强调了get请求的使用及URL的构造。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

做爬虫,免不了将抓取下来的数据保存到数据库,但是如何保存到数据库呢,下面我通过我工作中抓取的一个网站来展示,代码有点多,但是逻辑很简单,此例是将view Details的链接保存在了mysql中,先看看网站是什么样子:
这里写图片描述
下边这个图是页码
这里写图片描述
网站是这个样子,我在代码中有个判断,就是判断链接是否有三个,分别执行不同操作,就是根据图中标记来的
此次请求是get请求,不需要传参,只需要重新拼接url进行翻页即可
以下是代码全图:
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

其中有注释的才是需要注意的地方,代码这么多,着重看吧!

要将爬取数据保存MySQL数据库中,可以按照以下步骤进行操作: 1. 添加MyBatis依赖 在pom.xml文件中添加MyBatis的依赖: ``` <dependency> <groupId>org.mybatis.spring.boot</groupId> <artifactId>mybatis-spring-boot-starter</artifactId> <version>2.2.0</version> </dependency> ``` 2. 配置数据源 在application.properties文件中添加MySQL数据库的配置: ``` spring.datasource.url=jdbc:mysql://localhost:3306/your_database_name spring.datasource.username=your_username spring.datasource.password=your_password spring.datasource.driver-class-name=com.mysql.jdbc.Driver ``` 3. 创建实体类 创建一个与数据库表对应的实体类,属性名和表中的列名要一一对应,可以使用注解来指定表名和列名。例如: ``` @Table(name = "user") public class User { @Id @GeneratedValue(strategy = GenerationType.IDENTITY) private Integer id; @Column(name = "name") private String name; @Column(name = "age") private Integer age; // getter和setter方法 } ``` 4. 创建Mapper接口 创建一个Mapper接口,用于定义操作数据库的方法。例如: ``` @Mapper public interface UserMapper { @Insert("insert into user(name, age) values(#{name}, #{age})") int addUser(User user); } ``` 5. 注入Mapper接口 在需要操作数据库的地方注入Mapper接口,并调用其中的方法即可保存数据。例如: ``` @Service public class UserService { @Autowired private UserMapper userMapper; public void saveUser(User user) { userMapper.addUser(user); } } ``` 以上就是使用Spring Boot和MyBatis保存爬取数据MySQL数据库的步骤。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值