廖雪峰 Python3 笔记(一):Python部分基础杂谈

本文介绍了Python中的字符串转义、多行字符串表示、布尔值、算术运算、字符串编码及格式化等基础知识。针对字符串编码问题,详细解释了Unicode与UTF-8编码的区别及应用场景,并演示了如何在Python中进行编码转换。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、如果字符串里面有很多字符都需要转义,允许用r'...'表示,字符串内部不需要转义字符\

2、如果字符串内部有很多换行,用\n写在一行里不好阅读,为了简化,Python允许用'''...'''的格式表示多行内容:

>>> print('''line1
... line2
... line3''')
line1
line2
line3

3、一个布尔值只有TrueFalse两种值,要么是True,要么是False

4、关于除法

>>> 10 / 3
3.3333333333333335
取余数>>> 10 % 3
1
取除数>>> 10 // 3
3

5、Python的字符串编码问题

Unicode把所有语言都统一到一套编码里,通常2字节,在内存中统一使用。UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,文本包含大量英文字符,用UTF-8编码就能节省空间,硬盘和传输时使用。

在最新的Python 3版本中,字符串是以Unicode编码的。

源代码中包含中文的时候,在保存源代码时,就需要务必指定保存为UTF-8编码。

对于单个字符的编码,Python提供了ord()函数获取字符的整数表示,chr()函数把编码转换为对应的字符:

>>> ord('A')
65
>>> ord('中')
20013
>>> chr(66)
'B'
>>> chr(25991)
'文'

以Unicode表示的str通过encode()方法可以编码为指定的bytes,进而在网络上传输,或者保存到磁盘上例如:

>>> 'ABC'.encode('ascii')
b'ABC'  #b表示byte字节,此处将str转化为bytes
>>> '中文'.encode('utf-8')
b'\xe4\xb8\xad\xe6\x96\x87'
>>> '中文'.encode('ascii') #中文不可以使用ASCII编码Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

如果从网络或磁盘上读取了字节流,那么读到的数据就是bytes。要把bytes变为str,就需要用decode()方法:

>>> b'ABC'.decode('ascii') #decode('ascii',erroe='ignore')忽略错误
'ABC'
>>> b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')
'中文'

len()函数:str的字符数,计算bytes字节数

6、格式化

在字符串内部,%s表示用字符串替换,%d表示用整数替换,有几个%?占位符,后面就跟几个变量或者值,顺序要对应好。如果只有一个%?,括号可以省略。%2d表示用两位数整数,用0补位。%.2f表示浮点数,小数点后面取两位。转义,%%来表示一个%

>>> 'Hi, %s, you have $%d.' % ('Michael', 1000000)
'Hi, Michael, you have $1000000.'


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值