编码
编码的原理
- 编码是
将信息(如文本、图像、音频等)转换成计算机可以处理和存储的二进制格式(0和1)的过程。
不同的编码方案定义了不同的信息转换规则:
- 字符编码:用于将字符转换为数字。常见的有:
ASCII:美国信息交换标准代码,使用7位二进制编码表示128个字符。
Unicode:通用字符集,包含全球大多数文字和符号。常见的实现包括UTF-8、UTF-16、UTF-32。
GBK:中文字符编码,支持简体中文字符和一些常用的繁体中文字符。
UTF-8:Unicode的一种编码方式,使用1到4个字节表示一个字符,向后兼容ASCII。
编码过程就是根据这些规则,将每个字符转换成对应的数字(码点),再将这些码点转换成二进制格式。
除文本之外的数字、图片、音频、视频的常见编码
-
数字:
定点数:将数字的每一位固定为二进制数表示。
浮点数:用于表示非常大或非常小的数,例如IEEE 754标准。 -
图片:
JPEG:一种有损压缩的图像编码格式,适用于照片和复杂图像。
PNG:一种无损压缩的图像编码格式,适用于需要保留细节和透明度的图像。
GIF:一种适用于简单动画和低色彩图片的格式。 -
音频:
MP3:一种有损压缩音频格式&