【2018.12.14】python3.7 一个低级趣味的爬虫(requests+pyquery)妹纸的图哇咔咔

本文介绍了一个使用Python和requests库的简单爬虫程序,该程序从指定网站抓取美女图片并保存到本地。通过解析网页源码,提取图片链接和名称,再进行图片下载。文章展示了如何处理HTTP请求、解析HTML文档以及文件操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这是个低级趣味的爬虫

 

 

#!/practice/Study_Test python
# -*- coding: utf-8 -*-
# @Time    : 2018/12/13 23:35
# @Author  : yb.w
# @File    : 18_12_12_Sister.py
import os
import requests
from pyquery import PyQuery as pq
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36',
}

def get_requests(url):
    html = requests.get(url=url,headers=headers).content.decode("utf-8")
    doc = pq(html)
    items = doc('.span3').items()

    for each in items:
        # 向下查找 追加一个属性
        url_img = each.find("img").attr("src")
        name = each.find("img").attr("title")
        #再次请求网络 获取图像内容
        download_img = requests.get(url_img,headers=headers).content
        print('图片名字: %s 图片链接:%s'%(name,url_img))
        try:
            with open('./12_12_妹纸图/'+name+'.jpg','wb') as f:
                f.write(download_img)
        except OSError:
            continue


if __name__ == '__main__':
    file_path = os.path.join(os.getcwd(),'12_12_妹纸图')
    #判断路径是否存在
    if not os.path.exists(file_path):
        #不存在就创建这个文件夹
        os.makedirs(file_path)
    for item in range(1,15):
        url = "https://www.dbmeinv.com/?pager_offset=%s"%str(item)
        get_requests(url)


 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值