Scrapy爬取小实战——以新浪股市为例

GreatMoc

于 2021-10-22 15:27:30 发布

阅读量875

点赞数 3

CC 4.0 BY-SA版权

分类专栏： python 爬虫文章标签：爬虫 python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/GreatMoc/article/details/120904357

本文通过实例演示如何使用Scrapy爬取新浪股市评论的评论内容、时间及作者。介绍了创建spider项目、配置文件、编写爬虫代码等步骤，并提醒读者了解正则表达式或使用XPath辅助工具。最后，展示了运行结果和数据存储。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Scrapy爬取小实战——以新浪股市为例

前言

相信大家已经在优快云上找到了很多讲解scrapy爬虫原理、详解balabala…的一大堆，所以这里我就不去对scrapy的原理做什么讲解，就只是用代码与注释来告诉大家要如何操作scrapy写一个爬虫小应用。

第一部分：看看网站

这次案例我们要爬新浪股市某一条评论里面的三个内容：评论内容、时间、作者。
我随机打开一个评论：

可以看到要爬的就是框起来的三个内容，通过F12我们可以看到它详细的html代码，这里我就不打开看了。

因为我们后面爬取要涉及到正则表达式，所以建议大家要学会如何使用正则表达式来找信息，如果大家不会的话也可以下载chrome的xpath插件，查看每一部分的正则表达式代码。
这里附上链接：Xpath-helper插件下载戳这里！！！！.

第二部分：创建一个spider项目

首先，在你想要创建项目的目录下打开cmd并进入python环境：

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。