对于gzip返回压缩网站的编码解析(非使用类文件的io.BytesIO)

本文详细介绍了如何通过Python解析HTTP响应头,并使用gzip库解压缩网页内容,以便于进一步处理和展示。主要内容包括HTTP响应头解析、gzip解压缩以及编码转换。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

如果有网站返回如下:

Content-Type: text/html
Connection: close
Date: Sat, 30 Jul 2011 18:06:13 GMT
Server: SWS
Vary: Accept-Encoding,X-Up-Calling-Line-id,X-Source-ID,X-Up-Bearer-Type
Cache-Control: max-age=70
Expires: Sat, 30 Jul 2011 18:07:23 GMT
Last-Modified: Sat, 30 Jul 2011 18:05:22 GMT
Content-Encoding: gzip
Content-Length: 70442
FSS-Cache: HIT from 31589010.39519058.42621963

那么你可以这样做:

import urllib.request as ur
import gzip
w=ur.urlopen('http://www.sohu.com').read()
contents=gzip.decompress(w).decode('gbk')
print (contents)




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值