Scrapy入门教程中遇到的坑

最新推荐文章于 2025-08-20 15:37:55 发布

转载最新推荐文章于 2025-08-20 15:37:55 发布 · 392 阅读

·

0

·

文章标签：

#python #scapy #网络

Scrapy 专栏收录该内容

2 篇文章

订阅专栏

本文总结了跟随Scrapy官方入门教程过程中遇到的问题，包括网站地址变更、XPath及CSS选择器使用调整及Items导入错误等，并提供了解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

跟着Scrapy官方入门教程（http://scrapy-chs.readthedocs.io/zh_CN/latest/intro/tutorial.html）流程学习时候遇到的几个问题，由于没有及时更新这个网站，导致里面有些内容比较陈旧，有几个坑记录下来：

1、例子中使用的网站网址变更

所有www.dmoz.org都要替换成dmoztools.net，否则爬不到想要的东西

2、sel.xpath()报错： “sel” shortcut is deprecated.

xpath()和css()方法被移动到response了，所以要调用时应该这么写：

response.xpath("//div[@id='books']")

response.css("div#books")

3、from tutorial.items import DmozItem报错

有个解决办法是在items.py里写DmozItem类

目前整理到这里，发现还有什么问题的话会继续更新。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。