
1:创建项目


2:创建爬虫

3:编写start.py文件用于运行爬虫程序

4:设置settings.py文件的相关设置



爬取详情页数据

编写items.py文件

编写js.py

设计数据库和表
数据库jianshu
表article

id设置为自动增长

将爬取到的数据存储到mysql数据库中

运行start.py效果如下

本文介绍如何从零开始搭建一个爬虫项目,包括创建项目、编写爬虫、设置配置文件,以及如何抓取网页数据并将其存储到MySQL数据库中。详细步骤覆盖了项目初始化、爬虫编写、数据存储等关键环节。

1:创建项目


2:创建爬虫

3:编写start.py文件用于运行爬虫程序

4:设置settings.py文件的相关设置



爬取详情页数据

编写items.py文件

编写js.py

设计数据库和表
数据库jianshu
表article

id设置为自动增长

将爬取到的数据存储到mysql数据库中

运行start.py效果如下

2642
676