利用Requests爬取图片和文本--博主比较懒



一、利用Requests爬取图片

def save_Img(img_Url, filename,base_path):
    filename_abs=base_path+'\\'+filename+'.jpg'
    file=open(filename_abs,'wb')
    img=requests.get(img_Url,headers={'User-Agent':random.choice(headers.my_headers)},timeout=5)
    file.write(img.content)
    file.close()



二、Requests 爬取网页数据

def get_img_profile_chmuseum_Requests(url,base_path,urlTitle=None):
    html = requests.get(url, headers={'User-Agent': random.choice(headers.my_headers)}, timeout=5)
    tree=lxml.html.fromstring(html.content)
    title_fixed, pic_path, texts=get_contents_from_lxml(tree,urlTitle)
    save_Img(pic_path, title_fixed, base_path)
    save_Profile(texts, title_fixed,base_path)
def save_Profile(contents,filename,base_path):
    filename_abs = base_path + '\\' + filename + '.txt'
    file = open(filename_abs, 'w+')
    print '-----------Write to file------------'
    file.write(contents.encode('utf-8'))
    file.close()



                
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值