scrapy的extract() 、extract_first()方法,get() 、getall() 方法

本文介绍了Scrapy中用于提取数据的四个方法:extract()返回所有匹配的数据列表,extract_first()获取列表中的第一个数据,get()与extract_first()行为相同,而getall()则类似于extract()。get()和getall()在没有匹配项时会引发错误,而旧方法则返回None。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.extract()方法:


结果如下:


结论:说明了extract()方法返回的是符合要求的所有的数据,存在一个列表里。
2.extract_first()方法:

def parse(self, response):
    sel = Selector(response)
    hrefs = sel.xpath(r'//*[@class="c1 ico2"]/li/a/@href')
    print(hrefs.extract_first())

结果如下:

'/4253340.html'
1
结论:说明了extract_first()方法返回的hrefs 列表里的第一个数据。
3.get()方法:

def parse(self, response):
    sel 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小赖同学啊

感谢上帝的投喂

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值