python爬取股票代码_python爬取所有股票的个股资讯

最新推荐文章于 2024-10-26 20:52:00 发布

weixin_39734646

最新推荐文章于 2024-10-26 20:52:00 发布

阅读量865

点赞数

文章标签： python爬取股票代码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_39734646/article/details/111433087

版权

本文介绍了如何使用Python爬虫获取东方财富网上的所有股票代码，并通过新浪财经爬取相应股票的详细资讯，包括处理编码问题和过滤掉未上市或已退市的股票。整个过程涉及到requests、pyquery等库的使用，并将数据存储到数据库。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

由于毕设是要对股票的新闻报道进行情感分析，所以爬取所有股票的个股资是必要的前提工作了。一开始准备直接在

东方财富网上爬取所有的个股资讯，但是在获得个股资讯列表的时候要模拟事件。

前提工作

安装python3(下载地址)，在安装的时候选择添加到环境变量，如果没有选择，可以通过【右键我的电脑】->【属性】->【高级系统设置】->【环境变量】->【path】将安装的Python3的路径添加到path中。

通过命令行安装requests库：

pip install requests

3.安装 lxml

pip install lxml

4.安装pyquery

pip install pyquery

使用详情见静觅 » Python爬虫利器六之PyQuery的用法

5.安装pymysql

前提是先安装好mysql，然后同样采用

pip install pymysql

爬取数据

1. 爬取所有股票代码

分析网页的结果，由图片可知，股票代码为target为_blank的a标签的文本括号中的文字，股票名称为括号前的文字。因此对获得的text利用split函数进行处理得到股票代码和股票名称。

def getCodes():

codes=[]

url='http://quote.eastmoney.com/stocklist.html'

req =requests.get(url,timeout=30)

reporthtml

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。