数学运算符
+:拼接两个容器
*:重复生成容器元素
+=:用原容器与右侧容器拼接,并重新绑定变量
s = “abc”
s+=”D”
*=:用原容器生成重复元素,并重新绑定变量
< > >= <= == !=:依次比较两个容器中元素,一但不同则返回结果。
“abc”
“aaf”
成员运算
语法:数据 in 容器
数据 not in 容器
作用:判断容器中是否包含指定数据,返回bool类型。
字符串
定义
有一系列字符组成的不可变序列容器,存储的是字符编码值。
编码
字节Byte:计算机存储的最小单位,等于8位bit。
字符:单个的数字,文字,符号。
字符集(码表):存储字符与二进制序列的对应关系。
编码:将字符转换为对应的二进制序列的过程。
解码:将二进制序列转换为对应的字符的过程。
编码方式:
- ASCII编码:包含英文、数字等字符。每个字符1个字节。
- GBK编码:兼容ASCII,包含21003个中文。每个英文1个字节,汉字2个字节。
- Unicode字符集:国际统一编码,旧字符集每个字符2个字节,新字符集每个字符4字节。
- UTF – 8编码:Unicode的存储和传输方式。英文1个字节,中文3个字节。
相关函数
- ord(字符串):返回该字符串的Unicode码。
- chr(Unicode码):返回对应的字符串。
练习1:在控制台中输入一个字符串,打印该字符串的每个字符编码。
str_num = input("输入一个字符串:")
for item in str_num:
print(ord(item), end=" ")
练习2:循环输入编码值,显示字符。待输入负数时退出。
char = ""
while True:
int_num = int(input("输入一个编码值:"))
if int_num < 0:
break
else:
new_char = chr(int_num)
char += new_char
print(char)
char = ""
for item in range(1,1114111): # 编码值总上限:1114111
if 55296 <= item <= 57343: # 要扣除 55296-57343 不然会报错
pass
else:
new_char = chr(item)
char += new_char
print(char)