如何爬虫同花顺概念数据?pyppeteer

1.用Fiddler.exe抓包工具获取到动态网页的获取数据的地址:

2.常见的爬虫手段,发现网站的反爬虫非常厉害,直接屏蔽。selenium也不行。

3.最后发现pyppeteer可以,经过反复调整最后能稳定的获取到数据。最初的想法是能获取到全部的概念列表和概念成分列表,这样就能实时监控到概念的新增,然后及时提醒,

4.最后的单个网页的爬虫实现代码如下,其他同理:

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值