BOM(Byte Order Mark),字节顺序标记,出现在文本文件头部,Unicode编码标准中用于标识文件是采用哪种格式的编码,但它对于文件的读者来说是不可见字符。
下表列出不同的字符编码的BOM
| 编码 | BOM (十六进制) | BOM (十进制) | CP1252 字符 |
|---|---|---|---|
| UTF-8[t 1] | EF BB BF | 239 187 191 |  |
| UTF-16 (BE) | FE FF | 254 255 | þÿ |
| UTF-16 (LE) | FF FE | 255 254 | ÿþ |
| UTF-32 (BE) | 00 00 FE FF | 0 0 254 255 | ␀␀þÿ (␀ refers to the ASCII null character) |
| UTF-32 (LE) | FF FE 00 00 | 255 254 0 0 | ÿþ␀␀ (␀ refers to the ASCII null character) |
| UTF-7[t 1] | 2B 2F 76 382B 2F 76 392B 2F 76 2B2B 2F 76 2F[t 2]2B 2F 76 38 2D[t 3] | 43 47 118 5643 47 118 5743 47 118 4343 47 118 4743 47 118 56 45 | +/v8+/v9+/v++/v/+/v8- |
| UTF-1[t 1] | F7 64 4C | 247 100 76 | ÷dL |
| UTF-EBCDIC[t 1] | DD 73 66 73 | 221 115 102 115 | Ýsfs |
| SCSU[t 1] | 0E FE FF[t 4] | 14 254 255 | ␎þÿ (␎ represents the ASCII “shift out” character) |
| BOCU-1[t 1] | FB EE 28 | 251 238 40 | ûî( |
| GB-18030[t 1] | 84 31 95 33 | 132 49 149 51 | „1•3 |
本文详细介绍了BOM(Byte Order Mark)的概念及其在不同字符编码格式中的表现形式。BOM是一种特殊的标记,用于指示文本文件所使用的Unicode编码方式。文章提供了包括UTF-8、UTF-16等常见编码格式的BOM示例。
154

被折叠的 条评论
为什么被折叠?



