1.scrapy常用命令
- startproject :创建一个新的项目
- genspider:根据模板生成一个新的爬虫
- crawl:执行爬虫
- shell:启动交互式抓取控制台
- items.py:文件定义了待抓取域的模型
- settings.py:定义了一些设置,如用户代理和爬取延时等
- spiders/:目录存储实际的爬虫代码
定义模型
Item是一个模板,
创建爬虫
通过genspider命令,传入爬虫名,域名,以及可选的模板参数,就可以生成初始模板了
优化设置
本文介绍了Scrapy爬虫的基本使用方法,包括常用命令、文件结构及创建步骤。通过startproject、genspider等命令可以快速搭建爬虫框架,并通过优化settings配置提升爬取效率。
1.scrapy常用命令
定义模型
Item是一个模板,
创建爬虫
通过genspider命令,传入爬虫名,域名,以及可选的模板参数,就可以生成初始模板了
优化设置
2300
1698

被折叠的 条评论
为什么被折叠?