xml中的字符引用 也叫作字符 实体 或编号实体 ,例如我们可以
也可以
第二种方式就叫做编号实体 ,在xml规范中定义了5个实体:
我们可以通过名称quot、amp……来引用,也可以通过数字34、38……来引用。平时常用的(定义在HTML中的)实体还有:
我的问题是,在dom4j 使用SAXReader解析xml文档时,其中的字符实体 、©都会变成问号——?,理论上来说 这里的数字(160、169)是字符在编码表中的(十进制)编码值,我给SAXReader设置的encoding是utf-8,难道unicode中没有160、169这两个值?
不知道大家是否有遇到这样的问题,有没有什么解决方法或思路?
本文探讨了使用DOM4J和SAXReader解析XML文档时遇到的问题,即某些字符实体如&#160和&#169被错误地显示为问号。文中详细介绍了这些实体的作用及正确的显示效果,并提出了疑问寻求解决方案。
1098

被折叠的 条评论
为什么被折叠?



