Scrapy架构爬取网页步骤
一、新建项目 (scrapy startproject xxx):新建一个新的爬虫项目
1、在pycharm开发工具终端输入命令:
scrapy startproject mySpider
2、执行命令之后在保存路径下会出现项目:
3、在pycharm中新建项目:
二、明确目标 (编写items.py):明确你想要抓取的目标
1、构建 item 模型
1、在pycharm开发工具终端输入命令:
scrapy startproject mySpider
2、执行命令之后在保存路径下会出现项目:
3、在pycharm中新建项目:
1、构建 item 模型