自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 python爬取百度贴吧图片

以百度贴吧明星吧为例,我们可以看到里面有很多图集,选择殷桃吧,点开后,通过F12打开网页源代码,刷新网页,在Network里找到list连接,headers里的url就是我们需要发送请求的地址。在preview里,可以找到图片地址murl。用正则表达式的方式来寻找图片地址。re.search :扫描整个字符串并返回第一个成功的匹配。re.match:从字符串的起始位置匹配。.:匹配除了换行符之外的任意字符。re.findall:全局匹配。

2024-01-10 21:23:44 433

原创 Python爬取51.job信息

在搜索处右键选择检查,可以查看到当前位置对应的id名称,我们可以根据id来选择元素。在这里以测试工程师为例,在搜索框输入完毕后,点击搜索按钮,也是通过id的方式来找到搜索键。1.使用selenium调用浏览器驱动访问51.job,在这里使用的是火狐浏览器。2.输入要查询的岗位名称,点击搜索,显示所有js。在51.job网页中利用F12查看网页源代码。4.存储数据到txt文件。3.解析js源代码。

2024-01-06 20:53:26 639 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除