[原创]Python+selenium+Chrome爬取excel网站

本文介绍了一种使用Python爬取水利网站中特定表格数据的方法。通过requests和selenium库发送POST请求并处理只读属性,成功实现了从两个表格中提取数据,并将其整合到一个Excel文件中的过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近要写一个水利网站的爬虫脚本,将网页中2个excel的数据,爬到一个excel表里

恩,就是下面的网页截图,一左一右两张表。左边日期控件,输入对应日期查询相应日期的数据。

看到这么简单的网页,真是好开心,分分钟就给你数据

用requests库,发post请求,使用fiddler或者Burpsuite抓包测试都正常,但是用脚本,始终获取不到page_source

终于,发现日期输入框的属性是 readonly,于是果断使用selenium删除掉readonly属性,然后获取page_source,用BeautifulSoup处理数据

同样方法把右表的数据提取出来,最后结果截图:

 

转载于:https://www.cnblogs.com/hazelrunner/p/9020742.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值