到底用不用Scrapy

本文探讨了Scrapy这一Python爬虫框架的实际应用效果。虽然Scrapy因异步框架Twisted和高并发能力受到推崇,但在实际操作中,作者发现直接使用Python工具库和调用网站API更为简便,且高并发可能对目标网站造成过大压力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

到底用不用Scrapy

Scrapy是个什么

现在Python语言火的不得了,书很多,教程也多,学习班也多,基本上爬虫编写成了必修课。Scrapy的出镜率也随之增高。Scrapy是Python语言开发的比较成熟爬虫框架,是打包方案,底层是异步框架 twisted ,并发是最大优势,他把数据爬取工作进行了结构话的封装,初衷是为了让开发人员更加专注于页面分析。

真的好使吗

由于工作需要,本人要对若网站的数据进行自动化抓取,拿来Scrapy用用吧。整体感觉Python已经提供了很多简单的工具库,本身编写爬虫已经很简单了,用了框架反而增加了很多麻烦。而且网站很多都可以直接调用AJAX的接口获取结构化数据。并发太多会给网站增加很多压力,别人运营网站也不容易,都开几十个并发去爬,无疑就是一种攻击行为。所以后面就还是自己放弃了框架的使用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值