Python学习笔记四：字符串

最新推荐文章于 2023-04-13 09:30:43 发布

原创最新推荐文章于 2023-04-13 09:30:43 发布 · 400 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

Python 专栏收录该内容

9 篇文章

订阅专栏

本文详细介绍了Python3中字符串的编码方式，包括Unicode编码的使用，ord()与chr()函数的操作，以及如何利用encode()和decode()方法在str与bytes类型间转换。文章还探讨了不同场景下编码的选择及注意事项。

编码

PYthon3版本中，字符串是以Unicode编码的，也就是说，Python支持多语言

字符串

ord()，chr()

对于单个字符的编码，Python提供了ord()函数获取字符的整数表示,chr()函数把编码转换为对应的字符

PS：ord()需要''，chr不可加''

encode(),decode()

由于Python的字符串类型是str，在内存中以Unicode表示，一个字符对应若干个字节。如果要在网络上传输，或者保存到磁盘上，就需要把str变为以字节为单位的bytes。

Python对bytes类型的数据用带b前缀的单引号或双引号表示：

x=b'ABC'

要注意区分'ABC'和b'ABC'，前者是str，后者虽然内容显示得和前者一样，但bytes的每个字符都只占用一个字节。

以Unicode表示的str通过encode()方法可以编码为指定的bytes，例如：

纯英文的str可以用ASCII编码为bytes，内容是一样的，含有中文的str可以用UTF-8编码为bytes。含有中文的str无法用ASCII编码，因为中文编码的范围超过了ASCII编码的范围，Python会报错。

在bytes中，无法显示为ASCII字符的字节，用\x##显示。

反过来，如果我们从网络或磁盘上读取了字节流，那么读到的数据就是bytes。要把bytes变为str，就需要用decode()方法：

如果Bytes中包含无法解码的字节，decode()会报错

如果bytes中只有一小部分无效的字节，可以传入errors='ignore'忽略错误的字节：

len()

函数计算的是str的字符数，

如果换成bytes，len()函数就计算字节数：

可见，1个中文字符经过UTF-8编码后通常会占用3个字节，而1个英文字符只占用1个字节。

在操作字符串时，我们经常遇到str和bytes的互相转换。为了避免乱码问题，应当始终坚持使用UTF-8编码对str和bytes进行转换。

由于Python源代码也是一个文本文件，所以，当你的源代码中包含中文的时候，在保存源代码时，就需要务必指定保存为UTF-8编码。当Python解释器读取源代码时，为了让它按UTF-8编码读取，我们通常在文件开头写上这两行：

python3与python2语法是不同的，注意

在python解释器中-*-不是下划线，注意

颜色如图为红色，这是正常的

格式化

在Python中，采用的格式化方式和C语言是一致的，用%实现

%运算符就是用来格式化字符。在字符串内部，%s表示用字符串替换，%d表示用整数替换，有几个%？占位符，后面就跟几个变量或者值，顺序一一对应。如果只有一个%?,括号可以省略。

常见占位符有：

%d 整数

%f 浮点数

%s 字符串

%x 十六进制整数

其中，格式化整数和浮点数还可以指定是否补0和整数与小数的位数

首先，引入一个场宽的概念，在C语言中代表格式化输出字符的宽度

例如：可以在%与字母之间插进数字表示最大场宽

%3d表示输出3位整型数，不够3位右对齐.

%9.2f表示输出场宽为9的浮点数，其中小数位为2，整数为6，不够9位右对齐，注意，小数点前的数字必须大于小数点后的数字，也就是9>2，小数点前的数值规定了打印的数字的总字宽，如果忽略了，则意味着总宽度无限制

%03d，表示位数不够以0补充

%s永远起作用，会把任何数据类型转换为字符串

%%是转义，表示%符号

format()

另一种格式化字符串的方法是使用字符串的format()方法，它会用传入的参数依次替换字符串内的占位符{0}、{1}……

-

注意缟码，符号

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。