java判断字符编码格式

                String str = line;
                String[] encodings={"iso8859_1","gb2312","utf-8","GBK"};
                String encoding="";
                try
                {
                    for(int i=0;i<encodings.length;i++)
                    {
                    if(str.equals(new String(str.getBytes(),encodings[i])))               
                        System.out.println(str);
                    else
                        System.out.println("Unknown");
                    }
                }
                catch(Exception e)
                {
                e.printStackTrace();
                }

 

//和我用JavaScript判断一个字符串是不是数字是一个道理的

 

String str = new String(data.getLineInfo().getBytes("GBK"), "UTF-8");转码的方法

Java中,判断字符串的编码格式并非直接内置的功能,因为一旦字符串已经存在,它的字节序列就固定了,无法从已存在的字符串确定其原始编码。但是,你可以通过一些间接方法尝试推断,例如: 1. **试错法**:尝试使用常见的几种编码(如ISO-8859-1、UTF-8、GBK等)去解码字符串,看哪种能成功地显示出来,虽然这不是一种可靠的方式,但对于简单的文本字符串可能有效。 ```java public String guessEncoding(String input) { byte[] bytes = input.getBytes(Charsets.UTF_8); for (Charset charset : Charset.availableCharsets().values()) { try { String decoded = new String(bytes, charset); return charset.displayName(); } catch (UnsupportedEncodingException e) { continue; } } throw new RuntimeException("Failed to guess encoding"); } ``` 2. **文件读取**:如果是从文件加载的字符串,可以查看文件本身的编码声明(比如在HTML的meta标签中),或者检查文件头的BOM(Byte Order Mark)标记,比如UTF-8的BOM是`\uFEFF`。 3. **使用第三方库**:有些工具包如Apache Commons Text的`Charsets`类提供了检测常见编码的功能,但它们依赖于预定义的规则和特征,也不是百分之百准确。 然而,最好的做法是在输入字符串之前就知道其编码,尤其是在网络接收或者用户输入的情况下。如果你能够控制字符串的生成过程,应该尽可能明确地指定编码。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值