今天用convert.py处理xml数据时出现了下面这个错误
原因是:xml文件中有中文,所以编码错误,解决办法是:读xml文件的时候用gdb来读,如下:
with open(xml_file, "r",encoding="gbk") as f:
xml_str = f.read().encode("utf-8")
但是注意,这里第二行还是要用utf-8,因为lxml.etree需要使用这个编码,不是的话会报下面的错误:
今天用convert.py处理xml数据时出现了下面这个错误
原因是:xml文件中有中文,所以编码错误,解决办法是:读xml文件的时候用gdb来读,如下:
with open(xml_file, "r",encoding="gbk") as f:
xml_str = f.read().encode("utf-8")
但是注意,这里第二行还是要用utf-8,因为lxml.etree需要使用这个编码,不是的话会报下面的错误: