字节顺序记号
是编码为 U+FEFF
的统一码
字符("零宽度无断空白")。当以 UTF-16 或 UTF-32 来对UCS
或Unicode字符编码时,这个字符被用来标示其字节序。它常被用来当做标示文件是 UTF-8 、 UTF-16
或 UTF-32 编码格式的文件记号。
UTF-8 则没有字节顺序的概念。UTF-8编码过的字节顺序记号则被用来标示它是
UTF-8 的文件。它只用来标示一个 UTF-8 的文件,而不用来说明字节顺序。 许多应用程式(包含记事本
)会添加字节顺序记号到 UTF-8 文件中。然而,在有一些Unix系统
中,这种作法则不被建议采用。字节顺序记号在 UTF-8 中被表示为序列 EF BB BF
,对大部分未准备好处理 UTF-8 的 文本编辑器 及 网页浏览器
而言,在 ISO-8859-1
的环境中则会显示 
。
编码 | 表示 (十六进制 ) | 表示 (十进制) |
---|---|---|
UTF-8 |
EF BB BF
|
239 187 191
|
UTF-16(大端序) |
FE FF
|
254 255
|
UTF-16(小端序) |
FF FE
|
255 254
|
UTF-32(大端序) |
00 00 FE FF
|
0 0 254 255
|
UTF-32(小端序) |
FF FE 00 00
|
255 254 0 0
|