爬虫学习笔记-scrapy安装及第一个项目创建问题及解决措施

DevCodeMemo

已于 2024-02-03 15:04:10 修改

阅读量711

点赞数 15

文章标签：爬虫学习笔记

于 2024-01-31 10:32:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/2301_77321248/article/details/135946685

版权

1.安装scrapy

pycharm终端运行 pip install scrapy -i https://pypi.douban.com/simple

2.终端运行scrapy startproject scrapy_baidu,创建项目

问题1:lxml版本低导致无法找到

解决措施:更新或者重新安装lxml

3.项目创建成功

4.终端cd到项目的spiders文件夹下,cd scrapy_baidu\scrapy_baidu\spiders

创建爬虫文件名百度,域名scrapy genspider baidu www.baidu.com

5.爬虫文件创建成功打开,修改def parse,打印输出

6.运行爬虫文件,scrapy crawl baidu

问题2:attrs版本低

解决措施:重新安装

7.再次运行爬虫文件,scrapy crawl baidu

问题3:无法加载sqllite3

解决措施:下载sqllite dll文件,解压到python解释器对应DLLs文件夹下

https://www.sqlite.org/download.html

8.禁用robot协议

9.再次执行后成功运行打印输出

10.注意:退出项目后,再次启动,需要cd到spiders目录下执行scrapy crawl baidu再启动项目

博客等级

码龄2年

55
原创

644
点赞

501
收藏

490
粉丝

关注

私信

热门文章

上一篇：: 爬虫学习笔记-Cookie登录古诗文网

下一篇：: 爬虫学习笔记-scrapy爬取汽车之家

最新评论

Python学习笔记-数采程序常见的连接错误
普通网友: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章涵盖了很多实用的知识点。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Python学习笔记-Flask接收post请求数据并存储数据库
优快云-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
Python学习笔记-Flask实现简单的抽奖程序
满心欢喜love: 稍微简陋了一点，博主可以再精进一下
爬虫学习笔记-post请求获取翻译详情
优快云-Ada助手: 恭喜您撰写了第13篇博客！标题“爬虫学习笔记-Post请求获取翻译详情”听起来很有趣。您对爬虫学习的热情和持续的创作精神值得赞赏。通过学习如何使用Post请求获取翻译详情，您为读者提供了一个实用的技巧。在下一步的创作中，或许您可以考虑分享一些关于数据处理和分析的技术，这将进一步丰富您的博客内容。谦虚之心使人进步，期待您未来更多精彩的博文！
爬虫学习笔记-get请求获取豆瓣电影排名数据
优快云-Ada助手: 恭喜您撰写第14篇博客！标题很吸引人，内容更是让人期待。学习爬虫并应用于获取豆瓣电影排名数据，这是一个非常有趣且实用的主题。您的博客不仅提供了学习笔记，还能让读者了解到如何通过get请求获取数据，非常有帮助。在下一步的创作中，或许您可以考虑分享一些更多的应用案例，例如如何分析电影排名数据，或者如何利用获取的数据做一些有趣的图表展示。这样的创作将进一步拓展读者的知识，让他们能够更深入地了解爬虫的实用性。再次恭喜您，期待您的下一篇博客！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。