1、进制和字符编码
1.1 二进制
- 机器可识别的:0、1
- 其它的状态补位数,二进制1个字节是8个位
- 最小单位是位(bit)
- 8个位数可以表示28=256种状态(符号)
1.2 几个进制的简单比较
十进制是默认的输入输出进制
进制 | 基本数 | 逢几进一 | 表示形式 |
---|---|---|---|
十进制 | 0~9 | 10 | 118 |
二进制 | 0、1 | 2 | 0b1110110 |
八进制 | 0~7 | 8 | 0o166 |
十六进制 | 0~9、 A~F | 16 | 0x76 |
1.3 单位公式换算
8bit(位,比特)=1Byte(字节)
1024Byte=1KB(千字节);1KB=8Kb
1024KB=1MB(兆字节);1MB=8Mb
1024MB=1GB(吉字节);1GB=8Gb
1024GB=1TB(太字节);1TB=8Tb
1.4 计算机为什么能认识你的代码
- ASCII码表(十进制):基础符号、大小写英文字母等128个基础字符的表示
- GB2312:简体中文字符集,可以表示7445个中文字符
- GBK:增加了繁体中文字符的表示
- GB18030:27484个字符,既支持简体繁体中文字符,也支持维吾尔文、藏文等字符
- Unicode:几乎包含全世界的字符(防止不同字符集对同一字符的表示不一致),所有字符都用2个ACSII字节表示
- UTF-8:英文用1个ASCII字节表示,中文用3个ASCII字节表示
2、python中的标识符和保留字
2.1 保留字
- 某些单词被赋予了特定意义,你在给你任何对象取名时都不能用这些特定意义的单词
- 不用特别记,因为你误用了程序也会报错
- 如何查看保留字有哪些
>>> import keyword
>>> print(keyword.kwlist)
['False', 'None', 'True', 'and', 'as', 'assert', 'async', 'await', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield']
2.2 标识符
- 需要自己取名字的都叫标识符
- 取名规则:
1)组成:字母、数字、下划线
2)数字不能打头
3)不能是保留字
4)严格区分大小写