python爬虫基础知识之requests,读取图片的两只方式,cookies,beautifulsoup

本文介绍了Python爬虫中requests库的使用,包括发送请求、传递URL参数、定制请求头、Post请求、处理响应状态码、重定向、超时设置等。同时,讲解了如何读取和处理二进制内容,特别是针对图片的抓取,使用PIL库和BytesIO进行处理。此外,还提及了提交表单、管理cookies以及重定向的操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Requests

1.        

o  发送请求

o  传递URL参数

o  读取响应内容(文本/二进制/Json)

o  定制请求头部

o  Post请求

o  响应状态码

o  重定向和历史

o  超时

 

2.       处理二进制内容导入包

 

#抓取图片

from PIL import Image

#处理二进制内容

from io import BytesIO

 

3.       图片处理

1)       #二进制数据

r=requests.get('http://img.mshishang.com/pics/2016/1209/20161209125708793.jpeg')

image=Image.open(BytesIO(r.content))

image.save('shauige.jpg')


 

2)       #原始数据处理,还是处理图片的例子,利用流处理,效率高

r=requests.get('http://img.mshishang.com/pics/2016/1209/20161209125708793.jpeg',stream= True)

#w表示写,b表示二进制,+表示原来有的话删除掉

while open('shuaige2.jpg','wb+') as f:

  for chunk inr.iter_content(1024):

    f.write(chunk)


 

4.       提交表单and cookies  and 重定向

#提交表单


form={'username':'user','password':'pass'}

r=requests.get('http://httpbin.org/post',data=form)

print(r.text)

r=requests.post('http://httpbin.org/post',data=json.dumps)

print(r.text)


#cookie

url='http://www.baidu.com'

r=requests.get(url)

cookies=r.cookies

for k, v in cookies.get_dict().items():

  print(k,v)

 


 

 

 

5.       Beautiful soup

soup=Beautifulsoup(open(url))


 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值