《Modern Python Cookbook》（Python经典实例）笔记 1.12　解码字节——如何根据字节获得正确的字符

最新推荐文章于 2021-03-02 09:00:14 发布

原创最新推荐文章于 2021-03-02 09:00:14 发布 · 1.6w 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #字符串 #字节 #decode

《Python经典实例》专栏收录该内容

13 篇文章

订阅专栏

博客聚焦于文件编码处理问题，指出从互联网下载的文件多以字节为单位，探讨如何从字节流中解码字符。介绍了字节流使用b’前缀，可通过Python的decode()方法将字节解码为字符串，解决没有正确编码或使用ASCII编码的文件处理问题。

如何处理没有正确编码的文件？如何处理使用ASCII编码的文件？
从互联网上下载的文件几乎都是以字节而不是字符为单位的。如何从字节流中解码字符呢？
字节流使用b’前缀，使用decode()方法可以将字节解码为字符串。

In [1]: bytes_str=b'abc'
In [2]: bytes_str
Out[2]: b'abc'
In [3]: type(bytes_str)
Out[3]: bytes
In [4]: utf_str= bytes_str.decode('utf-8')
In [5]: utf_str
Out[5]: 'abc'
In [6]: type(utf_str)
Out[6]: str

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

mighty13

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

精选资源

Modern Python Cookbook-现代Python编程实战指南第三版：涵盖Python 3.12新特性与工具的应用实例

04-15

内容概要：《Modern Python Cookbook》第三版提供了超过130个更新的Python 3.12编程技巧和工具，涵盖从基础语法到高级应用集成的广泛主题。书中详细介绍了Python的核心概念和技术，如迭代器、生成器、类型匹配、输入...

精选资源

Modern Python Cookbook

热门推荐

NicolasLearner的博客

03-02

10万+

gocn_news_2018-12-31 1. Go 入门简介：http://t.cn/EbjzeSt 2. Go GraphQL 新手指南： https://tutorialedge.net/golang/go-graphql-beginners-tutorial/ 3. 你需要 Go web 框架吗：https://medium.com/@tusharsoni/do-you-need-a-web-framework-for-go-51171bb0ea8c 4. OpenEdge：开放的边缘计算平

Python3 Cookbook：《Python CookBook》一直是较为经典的Python教程

02-19

《Python CookBook》一直是较为经典的Python教程。它注重方法和技巧的讲解，能让学习者更好的理解Python这门语言，最终将技巧运用到项目中。本书作者是David Beazley大神，一位独立的计算机科学家、教育家，以及有着...

Modern Python Cookbook Code Files 《Modern Python Cookbook》随书代码

06-07

《现代Python Cookbook》是Steven F. Lott撰写的一本针对Python 3的实用编程指南，旨在帮助开发者掌握更高效、更简洁的编程技巧。这本书的随书代码文件名为"ModernPythonCookbook_Code"，其中包含了书中各个章节示例...

Modern Python Cookbook.pdf

09-10

《现代Python食谱》这本书是一本为忙碌的现代程序员提供的Python编程食谱集。作者是Steven F. Lott，一位从70年代就开始编程的老牌计算机专家。作为一名合同软件开发人员和架构师，他参与了从小型到大型的各种项目，...

《Modern Python Cookbook》（Python经典实例）笔记1.4 浮点数、小数、分数

mighty13的专栏

09-20

2万+

货币值计算计算货币值时，应当使用decimal模块，如果使用float会出现舍入和截断问题。 decimal.quantize()函数的使用。 decimal模块提供各种舍入规则。分数计算分数计算使用fractions模块。分母是2的幂时，分数得到的浮点值很精确，不是2的幂时会产生浮点近似值。

《Modern Python Cookbook》（Python经典实例）笔记1.2 命名

mighty13的专栏

09-20

2万+

类一般用大驼峰命名法CapitalizedCamelCase，即每个单词的首字母大写其他对象用蛇底命名法snake_case 文件名应当遵循Python命名法，要不然影响作为模块或包使用链式命名法：x=y=1

《Modern Python Cookbook》（Python经典实例）笔记1.3大整数和小整数

mighty13的专栏

09-26

2万+

Python3中有大整数和小整数之分。区分的标准在于是否大于sys.maxsize。小整数一般是4字节或8字节表示，差异在于Cython的编译器，32位小整数一般用32位表示，64位用64位二进制表示。网上很多教程里说整数只能小于sys.maxsize不太准确。因为的确可以使用一些超大的整数，比如2**10000，这个数有多大呢。用len(str(2**10000))算了下，总共3011位数字。

《Modern Python Cookbook》（Python经典实例）笔记1.5 真除法和向下截断除法（floor除法）

mighty13的专栏

09-28

2万+

对于除法我们一般有三种期待结果：商和余数真值，浮点值准确的分数商和余数计算用floor除法运算，即向下截断的除法运算和模运算。真值计算用真除法，即我们一般意义上的除法，得到浮点值结果有理分数计算可以使用fractions模块

《Modern Python Cookbook》（Python经典实例）笔记 1.13 使用元组

mighty13的专栏

12-02

1万+

Python基本数据类型中，元组应该是最容易被忽视的。创建元组创建元组，步骤如下。 (1) 把数据用()括起来。 (2) 用,把元素隔开。对于单例元组（只有一个元素的元组）,是不能省的 (1,) ()并不是必须的，某些情况下可以省略。 In [1]: 1, Out[1]: (1,) 字符串是字符的序列，而元组是元素的序列，而且元组是多种对象的序列。因为字符串和元组都是序列，所以它们有一些共同的特性，如索引、切片等等。元组最有特色的操作应该是元组解包和元组封包了！ ...

Modern Python Cookbook》（Python经典实例）笔记 2.3 编写长行代码

mighty13的专栏

12-03

1万+

Python一行代码的长度一般限制为不超过80个字符，因为这种做法符合众所周知的平面设计原则：短代码可读性强。关于每行的长度众说纷纭，但65个字符通常被认为是最理想的。语法规则清楚地表明，语句必须在单个逻辑（logical）行上完成。术语“逻辑行”提示了应该如何解决长语句问题。Python区分逻辑行和物理行，我们可以利用这些语法规则分解长语句。逻辑行包含一个完整的语句，它可以通过行连接（line joining）技术跨越多个物理行。Python语言参考手册称这种技术为显式行连接（explicit lin

《Modern Python Cookbook》（Python经典实例）笔记1.9　通过字符列表创建复杂的字符串

mighty13的专栏

12-01

1万+

案例说明： title = “Recipe 5: Rewriting an Immutable String” 要求对title进行以下操作：移除：之前的子字符串；将标点符号和空格替换为_，将所有字符转换为小写。思路：将字符串转换为列表，根据:的索引，利用切片删除:前的列表元素逐元素将字符转换为小写替换:后的子字符串中的空格和标点符号要点：本案例用到了string模块。string模块有两个重要的常量。 string.whitespace列出了所有常用的空白字符，包括空格和制表符。

《Modern Python Cookbook》（Python经典实例）笔记 1.11　编码字符串——创建ASCII和UTF-8字节

mighty13的专栏

12-02

1万+

Unicode字符通常被编码为字节序列。这些字符中既有很多标准编码，也有很多非标准编码。 Python通常使用操作系统的默认编码处理文件和互联网通信，每个操作系统的处理细节各不相同。使用PYTHONIOENCODING环境变量进行通用设置。在Python之外设置这个变量可以保证在操作系统范围内使用特定的编码。 Linux操作系统环境变量的设置命令如下：export PYTHONIOENCODING=UTF-8 Windows操作系统环境变量的设置方法：我的电脑\计算机 →高级系统配置 → 环境变量→高级

《Modern Python Cookbook》（Python经典实例）笔记1.7 使用正则表达式解析字符串

mighty13的专栏

11-27

1万+

Python内置了正则表达式模块re。分解复杂字符串最简单的方法是将字符串归纳为模式（pattern），然后编写描述该模式的正则表达式。案例：假设我们想分离某个食谱网站中的文本。每行内容如下所示： ingredient = "Kumquat: 2 cups" 操作步骤如下：（1）分析文本，概括模式，文本可以分为如下3个部分 (ingredient words): (amount digits) (unit words) （2）导入re模块（3）把模式改写为正则表达式（4）编..

《Modern Python Cookbook》（Python经典实例）笔记 1.10　使用键盘上没有的Unicode字符

mighty13的专栏

12-02

1万+

案例背景： Python默认支持Unicode。可用的独立Unicode字符有几百万个，这些字符中绝大多数我们使用键盘无法直接输入。很多计算机中的字体可能在设计时就没有考虑提供这些字符，特别是Windows计算机中的字体可能无法显示这些Unicode字符。Linux和Mac OS X几乎没有关于Unicode字符的问题。在本案例中，我们将讨论如何表示这些特别的Unicode字符。原理： Python使用转义序列（escape sequence）扩展普通字符。通过转义序列我们可以输入海量的 Unicod

《Modern Python Cookbook》（Python经典实例）笔记1.8 使用模板字符串.format()构建复杂的字符串

mighty13的专栏

11-30

1万+

我们一般使用模板以及相应替换规则将数据转换为更负责的字符串。

《Modern Python Cookbook》（Python经典实例）笔记1.6 改写字符串

mighty13的专栏

11-27

1万+

字符串是不可变类型，不能原位（inplace）修改字符串，即不能直接以索引或切片形式元素赋值直接替换字符串的内容。所以，修改字符串的操作都将新产生一个新的字符串对象。 In [1]: s='abc' In [2]: s[0]='b' --------------------------------------------------------------------------- TypeError Traceback (most rec

利用Python concurrent.futures加速并行处理——Python Cookbook实例

"《Python Cookbook》第3版高清中文完整版，主要讲解如何进行简单的并行编程，利用concurrent.futures库的ProcessPoolExecutor类在多CPU环境下加速计算密集型任务。书中通过一个实例展示了如何处理gzip压缩的Apache...

《Modern Python Cookbook》（Python经典实例）笔记 1.12 解码字节——如何根据字节获得正确的字符

《Modern Python Cookbook》（Python经典实例）笔记 1.12　解码字节——如何根据字节获得正确的字符