这个问题困扰了我好久。
答案是这样的:为了解析中文等ascii之外字符。
采用双字节编码时会通过在最前端插入的fffe或feff辨别是大端还是小端;这两个字符好像被称作bof:=bytes order flag;
xml正文的第一个字符一定是'<',通过这一点初步确定如何解码英文;
这个初步的解码能解开英文却不一定能解开其它字符,例如utf-8和gb2312中英文的编码是一样的,因此需要通过英文向解析器说明如何解析ascii之外的字符。
shit
本文探讨了XML文件中如何确定编码方式及字符集解析的方法。重点介绍了如何通过BOF标识来判断字节顺序,以及如何利用XML文档的特性进行初步的ASCII字符解码,并进一步解析非ASCII字符。
2376

被折叠的 条评论
为什么被折叠?