- 博客(2)
- 收藏
- 关注
原创 python爬取百度贴吧图片
以百度贴吧明星吧为例,我们可以看到里面有很多图集,选择殷桃吧,点开后,通过F12打开网页源代码,刷新网页,在Network里找到list连接,headers里的url就是我们需要发送请求的地址。在preview里,可以找到图片地址murl。用正则表达式的方式来寻找图片地址。re.search :扫描整个字符串并返回第一个成功的匹配。re.match:从字符串的起始位置匹配。.:匹配除了换行符之外的任意字符。re.findall:全局匹配。
2024-01-10 21:23:44
433
原创 Python爬取51.job信息
在搜索处右键选择检查,可以查看到当前位置对应的id名称,我们可以根据id来选择元素。在这里以测试工程师为例,在搜索框输入完毕后,点击搜索按钮,也是通过id的方式来找到搜索键。1.使用selenium调用浏览器驱动访问51.job,在这里使用的是火狐浏览器。2.输入要查询的岗位名称,点击搜索,显示所有js。在51.job网页中利用F12查看网页源代码。4.存储数据到txt文件。3.解析js源代码。
2024-01-06 20:53:26
639
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人