####Unicode规范中的BOM的概念:
BOM——Byte Order Mark,就是字节序标记。
####BOM的作用:
UTF-8不需要BOM来表明字节顺序,但可以用BOM来表明编码方式。
字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8编码是"EF BB BF"。
所以如果接收者收到以"EF BB BF"开头的字节流,就知道这是UTF-8编码了。
Windows就是使用BOM来标记文本文件的编码方式的。UTF-8编码的文件中,BOM占三个字节。
如图:文本内容有BOM

如图:文本内容无BOM

本文介绍了Unicode规范中的BOM概念及其作用。BOM即字节序标记,虽然UTF-8编码不需要BOM来标明字节顺序,但可以通过特定的字节序列EFBBBF来标明文件采用的是UTF-8编码。Windows系统常用BOM来标记文本文件的编码方式。
142

被折叠的 条评论
为什么被折叠?



