解析包含中文的xml出现编码错误Invalid byte 1 of 1-byte UTF-8 sequence

本文探讨了在处理XML文件时遇到编码不匹配的问题,并提供了五种解决方案:修改XML文件头编码、更改保存时的字符集、在代码中重新设置编码、使用IO读取时修改字符编码以及使用org.w3c.dom.Document解析。这些方法有助于确保XML文件能够正确解析和使用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

原因为:以非utf-8的编码格式执行保存操作

1、最简单就是把<?xml version="1.0" encoding="UTF-8"?>改成<?xml version="1.0" encoding="gbk"?>:对于字符串直接替换;对于文件,先读取,替换,最后解析写回
2、或者把xml打开另存的时候把字符集改为UTF-8后保存
3、在代码解析的时候先把xml重新写一遍
 SAXReader reader = new SAXReader(); 
  org.dom4j.Document document = reader.read("D:\\ha.xml"); 
  OutputFormat of = new OutputFormat(); 
  of.setEncoding("UTF-8"); //改变编码方式 
  XMLWriter writer = new XMLWriter(new FileWriter "d:\\dom4j.xml"), of); 
4、直接dom4j读取的时候用io来读,修改字符编码
FileInputStream in = new FileInputStream(new File(fileName));
Reader read = new InputStreamReader(in,"gbk");
Document document = reader.read(read);

5、还有可能出现以utf-8格式保存仍无法使用,此时,可使用org.w3c.dom.Document进行解析保存。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值