字符集与字符编码(理解ASCII、ANSI、UTF-8、Unicode,解决各种乱码问题)
一. 字符集与字符编码(理解ASCII、ANSI、UTF-8、Unicode,解决各种乱码问题)
字符集与字符编码(理解ASCII、ANSI、UTF-8、Unicode,解决各种乱码问题)
相信很多同学也像我一样,经常在工作和学习中遇到字符编码的疑惑或者受到乱码的困扰,每次遇到问题都需要去学习了解不同的名词含义甚至需要深入学习不同的编码机制,不胜烦恼,所以今天我将自己的学习心得记录下来,希望能简单明了地描述字符集和字符编码。
1 多种字符集与多种编码共存的原因
首先必须要认识到一点,不论是简单的字符还是更复杂的图像、声音、视频等都是用于描述现实世界的信息,只是信息的表现形式不同,可以理解为对现实世界抽象的结果。例如,远古时期的象形文字最初就像是将客观事物的外观画出来用于描述该客观事物,随着人类对世界的认知越来越深入,象形文字在信息传递过程中显得极为不便,于是文字就向着更为抽象且简单化、符合人类认知习惯的方向发展和转变,在这个过程中因为各个不同地区的人对世界的理解和认识不同,所以会形成不同体系的语言和文字,如中国使用汉语体系、日本使用日语体系、英美使用英语体系,这是造成多种字符集共存的历史和根