Scrapy入门、当当网商品爬取实战

本文介绍了如何使用Scrapy创建项目,详细讲解了从创建dangdang项目到运行爬虫文件的步骤。接着,文章进入了实战环节,展示了如何爬取当当网连衣裙第一页的商品名称、链接和评论数,并将数据存入数据库。

一.如何创建Scrapy爬虫项目

(1) Win+R 打开cmd,假如我要在F盘的Scrapy文件中创建项目,进入相应的地方,如下。(cd,是进入下一级,cd…是返回上一级,cd\是返回盘符)
在这里插入图片描述

(2)使用指令scrapy startproject dangdang创建名为dangdang的项目。
dangdang这个项目下包括了同项目名dangdang的核心目录和项目的配置文件scrapy.cfg,如下。
在这里插入图片描述(3) 点击核心目录,又发现了有很多文件,如下。
在这里插入图片描述
spiders文件夹放置我们的爬虫,可以使用scrapy genspider -t basic 文件名 域名创建爬虫文件,其中basic可以换,因为它是一个模版,还可换成:

Available templates:   #模板说明
  basic       创建基础爬虫文件
   crawl      创建自动爬虫文件
  csvfeed      创建爬取csv数据爬虫文件
  xmlfeed     创建爬取xml数据爬虫文件

哪个里面写什么,这和Scrapy架构有关系

Spider要做两件事:(1)定义爬取网站的动作   (2)分析爬取下来的网页
  _ init_.py:爬虫项目的初始化文件,用来对项目
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值