字符串和编码

本文详细介绍了Python中字符串的处理方法,包括如何使用encode()和decode()方法进行编码和解码,以及len()函数如何计算str和bytes类型的长度。此外,还讲解了Python中的字符串格式化技巧,展示了如何使用%运算符进行字符串的格式化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

以Unicode表示的str通过encode()方法可以编码为指定的bytes,例如:

‘ABC’.encode(‘ascii’)
b’ABC’
反过来,如果我们从网络或磁盘上读取了字节流,那么读到的数据就是bytes。要把bytes变为str,就需要用decode()方法:

b’ABC’.decode(‘ascii’)
‘ABC’
要计算str包含多少个字符,可以用len()函数:

len(‘ABC’)
3

len(‘中文’)
2

len(‘ABC’)
3

len(b’ABC’)
3len()函数计算的是str的字符数,如果换成bytes,len()函数就计算字节数:

len(‘中文’.encode(‘utf-8’))
6
可见,1个中文字符经过UTF-8编码后通常会占用3个字节,而1个英文字符只占用1个字节。

在Python中,采用的格式化方式和C语言是一致的,用%实现,举例如下:

‘Hello, %s’ % ‘world’
‘Hello, world’

‘Hi, %s, you have $%d.’ % (‘Michael’, 1000000)
‘Hi, Michael, you have $1000000.’
%运算符就是用来格式化字符串的。在字符串内部,%s表示用字符串替换,%d表示用整数替换,有几个%?占位符,后面就跟几个变量或者值,顺序要对应好。如果只有一个%?,括号可以省略。

常见的占位符有:

占位符 替换内容
%d 整数
%f 浮点数
%s 字符串
%x 十六进制整数
其中,格式化整数和浮点数还可以指定是否补0和整数与小数的位数:

‘Hi, %s, you have $%d.’%(‘skye’,100000000)
‘Hi, skye, you have $100000000.’

‘%2d-%2d’ % (3, 1)
’ 3- 1’

‘%d-0%2d’ % (3, 1)
‘3-0 1’

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值