Python2 爬虫（九） -- Scrapy & BeautifulSoup之再爬优快云博文

最新推荐文章于 2024-10-21 11:35:20 发布

原创

最新推荐文章于 2024-10-21 11:35:20 发布 · 1.9w 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python #爬虫 #scrapy #BeautifulSoup #csdn博客

本文介绍了如何使用Python的Scrapy框架和BeautifulSoup库合作，详细步骤包括创建Scrapy项目，定义数据Item，编写优快云Spider，实现Pipeline处理，配置设置文件，并最终运行爬虫来抓取优快云上的博客文章。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

序

我的Python3爬虫（五）博文使用utllib基本函数以及正则表达式技术实现了爬取csdn全部博文信息的任务。

链接： Python3 爬虫（五） -- 单线程爬取我的优快云全部博文

上一篇 Python3 爬虫（八） -- BeautifulSoup之再次爬取优快云博文，我们就利用BeautifulSoup4重新实现了一次爬取csdn博文的任务。

那么，既然认识了Scrapy和BeautifulSoup，哪有不让它们合作一下的道理呢？不过，既然要使用Scrapy框架，我不得不又转战Ubuntu，使用Python2.7了。还是希望Python3能够尽快的支持Scrapy框架哦~

嘿嘿，我又不厌其烦的继续爬优快云博文了，问我为什么

？也没啥，只不过是想做下简单对比而已，当然你也可以爬别的东西啦~~~

这次博客首页主题没变，所以就不重复展示了，参看爬虫（八）即可。

创建Scrapy项目

首先，利用命令scrapy startproject csdnSpider创建我们的爬虫项

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 12

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。