Python爬虫1-B站

Python爬虫图片
:https://www.vmgirls.com/13679.html
代码如下:

import requests
import re
import time
import os
#1请求网页,防方爬修改headers
headers={
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:75.0) Gecko/20100101 Firefox/75.0'
}
#自己的身份,请求比较大的网页
response=requests.get("https://www.vmgirls.com/13679.html",headers=headers)
#print(response.request.headers)
html=response.text

#2.解析网页
#@ctrl+f在源代码搜索
#F12查看元素,直接Copy再截取URL,再去原地址ctrl+f找到a标签
#<a href="https://static.vmgirls.com/image/2020/04/2020040211472139-scaled.jpeg" alt="想成为你喜欢的人" title="想成为你喜欢的人">
#获取图片标题,后来来打包用的
#<h1 class="post-title h3">想成为你喜欢的人</h1>
dir_name=re.findall('<h1 class="post-title h3">(.*?)</h1>',html)[-1]
if not os.path.exists(dir_name):
    os.mkdir(dir_name)
urls=re.findall('<a href="(.*?)" alt=".*?" title=".*?">',html)
#上面的href一定要加个(),不然报错
#打印图片路径列表
print(urls)

#3.保存图片
for url in urls:
    #time.sleep(1)
    #图片的名字,这里要具体看url图片路径去倒数第一个作为图片名字而已
    file_name=url.split('/')[-1]
    #请求刚刚得到的图片
    response = requests.get(url,headers=headers)
    with open(dir_name+'/'+file_name,'wb') as f:
        f.write(response.content)



评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值