在处理中文字符串的时候,如何处理�这个字符

本文详细解释了在编码转换过程中出现乱码字符�的原因,通常发生在从GB2312编码转为UTF-8编码时。文章提供了解决方案,确保服务器端与接收端编码一致,以避免此类问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

首先需要明白�这个字符是什么意思,是怎么产生的
解释:从某编码向Unicode编码转化时,如果没有对应的字符,得到的将是Unicode的代码“\uffffd”,也就是�这个字符。

比如:服务器端用GB2312对响应的数据进行编码,而接收端使用默认UTF-8编码接收是对应不上的,就会出现这个符号。

解决方法
跟服务器端保持一致的接收编码即可,如:


    /**
     * 将响应实体拼接成字符串返回
     *
     * @param entity 响应实体
     * @return 实体字符串
     */
    private static String entity2String(HttpEntity entity) {
        StringBuilder content = new StringBuilder();
        try (InputStream inputStream = entity.getContent();
             InputStreamReader inputStreamReader = new InputStreamReader(inputStream,"gb2312"); //这里的解析类型需要和服务器响应内容的Content-Type: text/html; charset=gb2312 里面的charset保持一致
             BufferedReader bufferedReader = new BufferedReader(inputStreamReader)) {
            // 读取数据
            String line;
            while ((line = bufferedReader.readLine()) != null) {
                content.append(line);
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
        return content.toString();
    }

符号解释引用处:
http://www.php.cn/php-weizijiaocheng-104615.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值