python爬虫抓取微信头像

本文介绍了一个使用Python爬虫抓取特定网站图片的实例,包括创建目录存储图片、发送HTTP请求获取页面内容及解析页面提取图片链接等关键步骤,并提及了后续图片格式转换的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

# -*- coding:utf-8 -*-

import urllib
import urllib2
import re
import os
import random

picCount = 0
picPath = "D:/testSpider"

#创建新目录
def mkdir(path):
    path = path.strip()
    isExists=os.path.exists(path)
    if not isExists:
        os.makedirs(path)
        return True
    else:
        print u"名为",path,u'的文件夹已经创建成功'
        return False

def saveImg(imageURL):
    u = urllib.urlopen(imageURL)
    print(imageURL)
    global picCount
    global picPath
    fileName = picPath+"/%d.jpg"%(picCount)
    data = u.read()
    f = open(fileName, 'wb')
    f.write(data)
    picCount = picCount + 1 
    print u"图片",picCount,fileName
    f.close()    
    

#saveImg("http://touxiang.yeree.com/pics/4c/227088.jpg")

#http://touxiang.yeree.com/m/tx/26623/list2.html

gHeads = {
    "User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36",
}

def downloadOneClass(url_d):
    nNum = 1
    for i in range(nNum):
        url = url_d%(i+2)
        print url
        #response = urllib2.urlopen(url)
        
        user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'  
        values = {'username' : 'cqc',  'password' : 'XXXX' }  
        headers = { 'User-Agent' : user_agent }  
        data = urllib.urlencode("")  
        request = urllib2.Request(url, data, headers)  
        response = urllib2.urlopen(request)  
        page = response.read()
        #print page
        pattern = re.compile('http://touxiang.yeree.com/pics/[a-zA-Z0-9]+/\d+.jpg')
        items = re.findall(pattern,page)
        for item in items:
            saveImg(item)
            return

def main():
    list = []
    for i in range(1000):
        intRandom = random.uniform(1, 20000) 
        if list.count(intRandom)>0:
            continue
        list.append(intRandom)
        url_d = "http://touxiang.yeree.com/m/tx/%d"%(intRandom)+ "/list%d.html"
        downloadOneClass(url_d)
        if picCount>1000:
            print "1000 get"
            return
            
mkdir(picPath) 
main()

图片抓取之后,可以用ps的批处理,将jpg图片修改为132*132分辨率的png图片,用于微信头像。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值