调用中间件接口的返回值是一个xml字符串,其中 charset="GB2312" ,但奇怪的是我使用下面这个函数来判断这个xml字符串,得到的结果却是 UTF-8。
mb_detect_encoding()
由于 xml 中 charset 的值为 GB2312,所以导致了
simplexml_load_string()
无法成功解析这个xml字符串
其实解决这个错误非常简单,使用 str_replace 函数将xml字符串中的编码格式替换为 UTF-8 后再使用json编码解码后就可以得到干净的数组元素。
$xml= str_replace('GB2312','UTF-8',$xml);
$xml= simplexml_load_string($xml);
$xml= json_encode($xml);//将对象转换个JSON
$xml=json_decode($xml,JSON_UNESCAPED_UNICODE);//将json转换成数组
本文介绍了一种解决XML字符串编码不匹配的问题,当从中间件接口获取到的XML字符串声明的编码为GB2312,但在实际检测中却被识别为UTF-8,导致simplexml_load_string()函数无法正确解析。通过使用str_replace()函数将XML字符串中的编码格式从GB2312替换为UTF-8,并结合json_encode()和json_decode()函数,最终实现了XML字符串的有效解析和转换。
312

被折叠的 条评论
为什么被折叠?



