创建工程
我是用的是pycharm开发,打开pycharm,然后在下面的“Terminal”中输入命令“scrapy startproject freebuf”。这句话是在你的工作空间中创建一个叫“freebuf”的scrapy工程。如下图:

上图中,因为我的工作空间中已经存在“freebuf”所以第一次创建失败,这里我创建的名字为"freebuf2",创建成功。freebuf2的目录及说明如下:

编写爬虫
freebuf2Spider.py
选中“spiders”文件夹,右键“NEW”->"Python File",输入文件名“freebuf2Spider”,添加代码。如下图所示。
#coding:utf-8
import scrapy
from freebuf2.items import Freebuf2Item
import time
from scrapy.crawler import CrawlerProcess
class freebuf2Spider(scrapy.Spider):
name ='freebuf2'
本文介绍了如何使用Scrapy在PyCharm中创建爬虫项目,并编写了一个名为'freebuf2Spider.py'的爬虫,用于翻页爬取数据。在items.py中定义了保存爬取数据的容器,同时在settings.py中设置了访问间隔时间以实现优雅的爬虫行为。最终,通过运行' scrapy crawl freebuf2 -o freebuf2.csv'将数据导出到CSV文件。
订阅专栏 解锁全文
996

被折叠的 条评论
为什么被折叠?



