Java文件编码的问题

本文通过一个Java示例程序展示了不同字符编码(GBK、UTF-8、UTF-16BE)如何影响字符串到字节序列及从字节序列到字符串的转换过程。演示了在使用错误的编码进行解码时会导致乱码的情况。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

package coreJava;

import java.io.UnsupportedEncodingException;

public class EncodeDemo {
    public static void main(String[] args) throws UnsupportedEncodingException {
        String s = "慕课网ABC";
        byte[] bytes1 = s.getBytes();//转换成字节序列用的是项目默认的编码gbk
        for(byte b : bytes1){
            //把字节(转换成了int)以16进制的方式显示
            System.out.print(Integer.toHexString(b & 0xff)+" ");
        }
        System.out.println();
        byte[] bytes2 =  s.getBytes("gbk");
        //gbk编码中文占用2个字节,英文占用1个字节
        for(byte b : bytes2){
            System.out.print(Integer.toHexString(b & 0xff)+" ");
        }
        System.out.println();
        byte[] bytes3 = s.getBytes("utf-8");
        //utf-8编码中文占用3个字节,英文1个字节
        for(byte b : bytes3){
            System.out.print(Integer.toHexString(b & 0xff)+" ");
        }
        //java是双字节编码utf-16be
        byte[] bytes4 = s.getBytes("utf-16be");
        //utf-16be中文占用2个字节,英文占用2个字节
        for(byte b : bytes4){
            System.out.print(Integer.toHexString(b & 0xff)+" ");
        }
        System.out.println();
        /*
         * 当你的字节序列是某种编码时,这个时候想把字节序列变成
         * 字符串,也需要用这种编码方式,否则会出现乱码
         */
        String str1 = new String(bytes4);//用项目默认的编码
        System.out.println(str1);
        String str2 = new String(bytes4,"utf-16be");
        System.out.println(str2);
        /**
         * 文本文件就是字节序列
         * 可以是任意编码的字节序列
         * 如果我们在中文机器上任意建文本文件,那么该文本文件只认识ansi编码
         * 联通/联这是一种巧合,他们正好符合了utf-8编码的规则
         */

    }
}

运行结果:

c4 bd bf ce cd f8 41 42 43 
c4 bd bf ce cd f8 41 42 43 
e6 85 95 e8 af be e7 bd 91 41 42 43 61 55 8b fe 7f 51 0 41 0 42 0 43 
aU孇Q
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值