NCR字符编码(形如中国)转换为汉字 in JAVA

本文详细解释了numericcharacterreference(NCR)编码原理,包括十进制和十六进制的Unicodecodepoint表示方法,并通过实例说明如何将NCR编码转换为正常字符。同时,分享了一种在Java中解决Linux环境下NCR编码问题的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

numericcharacterreference(NCR),数字取值为目标字符的Unicodecodepoint;以「&;#」开头的后接十进制数字,以「&;#x」开头的后接十六进制数字。「中国」二字分别是Unicode字符U+4E2D和U+56FD,十六进制表示的codepoint数值「4E2D」和「56FD」就是十进制的「20013」和「22269」。所以——中国中国——这两种NCR写法都会在显示时转换为「中国」二字。

转自&;#x开头的是什么编码呢

 

我在项目中碰到的情况是在window环境下不会出现这种问题,从前台传过来的文字保存到数据库中编码格式不会转变,但是在Linux下出现文字转变成NCR字符编码格式,在网上找寻了一些方法已经解决,特在此记录。

 

 

public class test {
    
    public static void main(String[] args) {
        String str = "#20013;国";
        String s = str(str);
        System.out.print(s);
    }
    
    
    public static String str(String str) {
        StringBuffer sb = new StringBuffer();
        String myString = str.replace("&#", "");
        String[] split = myString.split(";");
        for (int i = 0; i < split.length; i++) {
            sb.append((char) Integer.parseInt(split[i]));
        }
        return sb.toString();
    }
    
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值