python自学第11天之编码和解码-优快云博客

本文详细介绍了ASCII、GBK、Unicode及UTF-8等编码的特点与应用场景，包括它们支持的文字范围、位数以及在Python中的使用方法。

#ASCII码：

    不支持中文
    支持英文，数字，字母，符号
    8位  一个字节

#GBK 国标码:

    支持中文，日文，韩文，数字，符号
    英文，中文:  16位

#unicode 万国码:

    支持中文，英文，数字，符号
    英文，中文 :32位

#utf-8 长度可变的万国码   最少用 8位:

    英文 : 8位
    欧洲文字:16位
    中文:  24位

python3中 程序运行阶段 使用的都是unicode 显示所有的内容  不会进行传输和存储

传输和存储是bytes类型

pycharm存储的时候默认是使用utf-8

例：

        s = "alex"
        print(s.encode('utf-8'))    #encode 是编码  是指定要编码成什么样的编码类型
        print(s.decode('utf-8'))    #decode 是解码
        (*以什么编码就要以什么解码)

#utf-16 长度可变的万国码  最少用16位:

总结：

is 和 == 的区别

is 比较内存地址
    id()    ---获取内存地址

小数据池:
    数字的小数据池的范围是:  -5 ~ 256

字符串:
    字符串中不能包含特殊符号    +%&等
    字符串单个字符*20以内内存地址都是一样的，*21以上内存地址不一致

    注意:pycharm是个坑，一个py文件中所有的字符串 一般都是使用一样的内存地址

    == 比较两边的值


编码和解码:
    encode(编码方式) ---拿到铭文编码后对应的字节，unicode 变成你需要的编码
    decode(解码方式) ---将编码后的字节解码成对应的明文，目标bytes转换成字符串

    注意:用什么进行编码，就要用什么进行解码，不然会报错