Python-01_容器_编码值

本文介绍了Python中关于容器的数学运算符和成员运算,重点讲解了字符串的定义、编码概念,包括ASCII、GBK、Unicode和UTF-8编码方式,并提到了ord()和chr()函数的使用。通过两个练习帮助读者理解字符编码与解码的过程。

数学运算符

+:拼接两个容器

*:重复生成容器元素

+=:用原容器与右侧容器拼接,并重新绑定变量

        s = “abc”

        s+=”D”

*=:用原容器生成重复元素,并重新绑定变量

<  >  >=  <=  ==  !=:依次比较两个容器中元素,一但不同则返回结果。

       “abc”

       “aaf”

成员运算

语法:数据  in  容器

数据  not in  容器

作用:判断容器中是否包含指定数据,返回bool类型。

字符串

定义

有一系列字符组成的不可变序列容器,存储的是字符编码值。

 

 

编码

字节Byte:计算机存储的最小单位,等于8位bit。

符:单个的数字,文字,符号。

字符集(码表):存储字符与二进制序列的对应关系。

编码:将字符转换为对应的二进制序列的过程。

解码:将二进制序列转换为对应的字符的过程。

编码方式:

  1. ASCII编码:包含英文、数字等字符。每个字符1个字节。
  2. GBK编码:兼容ASCII,包含21003个中文。每个英文1个字节,汉字2个字节。
  3. Unicode字符集:国际统一编码,旧字符集每个字符2个字节,新字符集每个字符4字节。
  4. UTF – 8编码:Unicode的存储和传输方式。英文1个字节,中文3个字节。

相关函数

  1. ord(字符串):返回该字符串的Unicode码。
  2. chr(Unicode码):返回对应的字符串。

练习1:在控制台中输入一个字符串,打印该字符串的每个字符编码。

str_num = input("输入一个字符串:")
for item in str_num:
    print(ord(item), end=" ")

练习2:循环输入编码值,显示字符。待输入负数时退出。

char = ""
while True:
    int_num = int(input("输入一个编码值:"))
    if int_num < 0:
        break
    else:
        new_char = chr(int_num)
        char += new_char
print(char)
char = ""
for item in range(1,1114111):       # 编码值总上限:1114111
    if 55296 <= item <= 57343:      # 要扣除 55296-57343 不然会报错
        pass
    else:
        new_char = chr(item)
        char += new_char
print(char)

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值