- 博客(7)
- 收藏
- 关注
原创 某潮汐表逆向记录
这个网站是返回结果加密,比较复杂,本菜鸟觉得难度挺高的,一开始想用selenium之类的自动化工具爬取,发现这里用了canvas画布展示的数据,没法把数据一个个爬下来,遂只能扣代码了。首先,打开F12开发者工具,进来就是debugger。
2024-11-03 19:22:28
739
原创 BeauttifulSoup 在获取文本的时候 如何不获取子节点的文本
使用select方法时会获取到后续子节点的所有文本,之前解决的办法时使用lxml库进行提取,很麻烦,终于找到了一个方法:.contents[0]
2023-11-12 16:54:53
293
1
原创 BeautifulSoup学习笔记——获取元素文本
想获取td内的所有文本,之前一直使用lxml库进行解析,但是该方法只能获取单个元素的文本,无法获取元素内的所有文本,使用xpath方法获取所有文本时,由于这里有个style,会获取很多无用的东西,特别麻烦,今天学了一下BeautifulSoup,没想到功能强大多了,直接.text就能获取所有元素内文本,一行就能解决,实在太方便了。
2023-10-21 11:32:36
579
1
原创 selenium获取父节点和包含特定文本的元素的方法
以下代码的含义:首先获取包含文本CDPs的节点,再获取父节点(必须为th节点),进一步获取父节点(必须为tr节点)
2023-09-27 23:58:33
536
2
原创 python中selenium如何定位shadow-root中的元素
最近遇到了这个问题,找了好久,终于找到了,参考的是下面这篇文章,但是这篇文章写的比较简单并且有点小问题,对此进行补充,和记录。
2023-09-20 19:13:07
2322
7
空空如也
Django网页部署到服务器后不能post请求
2023-02-05
TA创建的收藏夹 TA关注的收藏夹
TA关注的人