计算机字符编码
什么是编码,为什么需要编码
编码是为了表示信息,便于编码后的信息跨越时空的传递。举个例子,人类第一次编码实践是通过声音彼此交流,声音发出者把自己的所感,所想,所见通过声音编码传递给其他人。但声音编码方式显然不太好,太远了声音就听不见了。于是人类发明了第二种编码方式——文字,文字成功解决了声音作为信息编码方式时的时空局限性。
划重点:编码是为了信息的传递(突破信息传播的空间局限性)和存储(图破信息传播的时间局限性)。
人类语言学的概念
个人觉得,人类文字解决了,但不只解决了一下两个问题:(当然还解决了很多其他问题,比如语法,标点等等。)
- 怎么写:英语规定了26个基本英文字母的大小写写法,不同单词由字母构成。汉语有些复杂,每一个单词都是一个完整象形文字,各象形文字写法不同。
- 如何读:英语中有元音和辅音,汉语中有声母和韵母,等等。
下面介绍一下人类语言中的一些基本概念,为后续深入研究计算机字符编码做一些准备
音素:(phoneme)
语言“读”范畴下的概念,是语音的最小单位,主要用于区分不同单词的读音。举个例子,kiss /kIs/和kill /kIl/用于在读音上区分这两个单词的s和l就叫做音素。
音节:(syllable)
语音中最自然的结构单位。确切地说,音节是音素组合构成的语音结构单位,每一个音节由头腹尾三部分构成,因此音节之间有很明显的界限。一般来说汉语每一个汉字只有一个音节(以声母开始以韵母结束),英语一个单词一般会有一个或多个音节,每一个音节一般以元音开始,以辅音结尾
字母表:(alphabet)
是字母的集合,字母确定了字母的写法,和字母能代表的音素。就英语来说,每一个英文字母可以代表一组音素,单词就是根据读音,把英文字母根据其音素排列起来形成的,可见英文是一种先有读音后有单词拼写方法的语言。
<