对于gzip返回压缩网站的编码解析(非使用类文件的io.BytesIO)

最新推荐文章于 2020-12-24 23:42:31 发布

Yatere

最新推荐文章于 2020-12-24 23:42:31 发布

阅读量1.2k

点赞数

CC 4.0 BY-SA版权

分类专栏： python 文章标签： import

本文链接：https://blog.youkuaiyun.com/yatere/article/details/6647701

python 专栏收录该内容

203 篇文章

订阅专栏

本文详细介绍了如何通过Python解析HTTP响应头，并使用gzip库解压缩网页内容，以便于进一步处理和展示。主要内容包括HTTP响应头解析、gzip解压缩以及编码转换。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

如果有网站返回如下：

Content-Type: text/html
Connection: close
Date: Sat, 30 Jul 2011 18:06:13 GMT
Server: SWS
Vary: Accept-Encoding,X-Up-Calling-Line-id,X-Source-ID,X-Up-Bearer-Type
Cache-Control: max-age=70
Expires: Sat, 30 Jul 2011 18:07:23 GMT
Last-Modified: Sat, 30 Jul 2011 18:05:22 GMT
Content-Encoding: gzip
Content-Length: 70442
FSS-Cache: HIT from 31589010.39519058.42621963

那么你可以这样做：

import urllib.request as ur
import gzip
w=ur.urlopen('http://www.sohu.com').read()
contents=gzip.decompress(w).decode('gbk')
print (contents)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Yatere

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Python中的数据压缩和解压缩：使用io.BytesIO()和gzip模块

专注于深入研究多种编程语言，以实战为导向，逐步拓展开发技能，提升工程化编码和思维能力，展现无敌技术实力。

10-05

433

数据压缩是现代计算中的关键技术，可用于节省存储空间和网络带宽。Python提供了强大的工具，如io.BytesIO()和gzip模块，用于处理二进制数据的压缩和解压缩。本文将介绍如何使用这些工具来轻松地进行数据压缩和解压缩，以提高你的数据处理效率。

Python 的 io.BytesIO()：内存中的二进制数据处理

专注于深入研究多种编程语言，以实战为导向，逐步拓展开发技能，提升工程化编码和思维能力，展现无敌技术实力。

10-04

1689

在 Python 编程中，处理二进制数据是一项常见任务。然而，有时您可能不想将数据写入实际文件，而是想在内存中进行操作。这就是 io.BytesIO() 登场的地方。本文将介绍 io.BytesIO() 类的基本用法，以及如何在内存中创建临时的二进制数据缓冲区，以便更高效地处理数据。无需担心创建临时文件，让我们深入了解这个强大的 Python 工具。

参与评论您还未登录，请先登录后发表或查看评论

StringIO和BytesIO

lyk-ops

12-06

351

StringIO 很多时候，数据读写不一定是文件，也可以在内存中读写。 StringIO顾名思义就是在内存中读写str。要把str写入StringIO，我们需要先创建一个StringIO，然后，像文件一样写入即可： >>> from io import StringIO >>> f = StringIO() >>> f.write('hello') 5 >>> f.write(' ')

Python的StringIO和BytesIO

Python研究所

10-02

163

点击蓝字关注我们吧！StringIO很多时候，数据读写不一定是文件，也可以在内存中读写。StringIO顾名思义就是在内存中读写str。要把str写入StringIO，我们需要先创建一...

python gzip_Python之gzip模块的使用

weixin_39958248的博客

12-03

1429

gzip模块作用:为GNU zip文件提供了一个类似的接口，它使用zlib来压缩和解压数据。1、写压缩gzip文件#!/usr/bin/env python3#encoding: utf-8importgzipimportioimportosout_file_name= "example.text.gz"with gzip.open(out_file_name,‘wb‘) as output:wi...

正在下载PDF文件... 解析PDF文件... 处理过程中发生错误: No /Root object! - Is this really a PDF?

最新发布

08-02

如果问题仍然存在，我们可以尝试使用浏览器直接下载PDF，然后使用本地文件进行解析。这样我们可以先确保PDF解析部分正常工作。因此，我们也可以添加一个功能：如果下载失败，则使用本地PDF文件（如果存在）进行...

【Python io库编码解码实践】：解决文本文件编码问题的有效方法

![【Python io库编码解码实践】：解决文本文件编码问题的有效方法]...# 1. Python io库概述及编码基础 Python的I/O（输入/输出）库是进行数据交换和处理的核心组件之一。它不仅处理文件读写，还涉及到网络通信、标准...

我能否在python中使用pickle库将对应的张量解析出来，通过http发送然后我在cpp中直接读取对应url的数据在c++中进行解码？

06-20

# Python端添加gzip压缩 import gzip compressed = gzip.compress(pkl_data) return send_file(io.BytesIO(compressed), mimetype='application/gzip') ``` 2. **增量传输**： - 对大张量使用分块传输编码 -...

【Python io库交互策略】：构建无缝文件处理生态系统的技巧

在Python的世界里，io库扮演着至关重要的角色，它是进行文件处理和其他I/O操作的基础。文件处理通常涉及读取、写入以及对文件的其他操作。随着数据量的增长和应用复杂度的提升，理解和掌握io库变得更加重要。本章将...

gzip包中文文档

qq_33967667的博客

09-23

583

参考： https://docs.python.org/3/library/gzip.html 我是从参考链接中将原文档翻译过来了。 gzip模块提供了一个压缩和解压缩文件的接口，如同GNU项目中的gzip和gunzip的功能。gzip模块提供了GzipFile类以及open()、compress()和decompress()函数。GzipFile类读取和写入gzip格式的文件，自动压缩或解压数据，使其看起来像一个普通的文件对象。注意，这个模块不支持可以由gzip和gunzip程序解压的其他文件格式，比如那

如何解决http封包中gzip编码的html

wfqxx的专栏

07-16

4859

gzip编码，最早由Jean-loup Gailly和Mark Adler创建，用于UNIX系统的文件压缩。我们在Linux中经常会用到后缀为.gz的文件，它们就是GZIP格式的。现今已经成为Internet 上使用非常普遍的一种数据压缩格式，或者说一种文件格式。HTTP协议上的GZIP编码是一种用来改进WEB应用程序性能的技术。大流量的WEB站点常常使用GZIP压缩技术来让用户感受更快的速度。（

gzip, StringIO的压缩和解压

heiyitian的专栏

02-28

525

if __name__ == "__main__": source_data = "123456789" #压缩 buf = StringIO.StringIO() gzip.GzipFile(fileobj = buf, mode = 'wb').write(source_data) compressed_data = buf.getvalue(

python——【1】gzip压缩文件

gy笨瓜的博客

12-24

4033

gzip模块压缩文件，依然是文件存储的三个步骤：创建文件对象 gz_file = gzip.GzipFile(…) 写入内容 gz_file.write(…) 文件对象关闭 gz_file.close() 具体说明（说明其中一种用法） 1 创建文件对象 gz_file = gzip.GzipFile(filename="image.jpg", mode="wb", compresslevel=9, fileobj=open("C:\\test.gzip", "wb")) 【参数说

Python之IO编程——文件读写、StringIO/BytesIO、操作文件和目录、序列化