#ASCII码:
不支持中文
支持英文,数字,字母,符号
8位 一个字节
#GBK 国标码:
支持中文,日文,韩文,数字,符号
英文,中文: 16位
#unicode 万国码:
支持中文,英文,数字,符号
英文,中文 :32位
#utf-8 长度可变的万国码 最少用 8位:
英文 : 8位
欧洲文字:16位
中文: 24位
python3中 程序运行阶段 使用的都是unicode 显示所有的内容 不会进行传输和存储 传输和存储是bytes类型 pycharm存储的时候默认是使用utf-8
例:
s = "alex"
print(s.encode('utf-8')) #encode 是编码 是指定要编码成什么样的编码类型
print(s.decode('utf-8')) #decode 是解码
(*以什么编码就要以什么解码)
#utf-16 长度可变的万国码 最少用16位:
总结:
is 和 == 的区别
is 比较内存地址
id() ---获取内存地址
小数据池:
数字的小数据池的范围是: -5 ~ 256
字符串:
字符串中不能包含特殊符号 +%&等
字符串单个字符*20以内内存地址都是一样的,*21以上内存地址不一致
注意:pycharm是个坑,一个py文件中所有的字符串 一般都是使用一样的内存地址
== 比较两边的值
编码和解码:
encode(编码方式) ---拿到铭文编码后对应的字节,unicode 变成你需要的编码
decode(解码方式) ---将编码后的字节解码成对应的明文,目标bytes转换成字符串
注意:用什么进行编码,就要用什么进行解码,不然会报错