java设置编码utf-16_Java UTF-16字符编码

本文详细介绍了UTF-16编码的不同形式及其产生的字节数差异。通过具体示例展示了如何使用Java程序来查看字符串在UTF-16、UTF-16LE及UTF-16BE编码下的实际字节表示。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

小编典典

在UTF-16版本中,由于插入了一个标记来区分Big Endian(默认)和Little

Endian,因此获得14个字节。如果指定UTF-16LE,则将获得12个字节(小尾数,不添加字节顺序标记)。

编辑- 使用此程序查看由不同编码生成的实际字节:

public class Test {

public static void main(String args[]) throws Exception {

// bytes in the first argument, encoded using second argument

byte[] bs = args[0].getBytes(args[1]);

System.err.println(bs.length + " bytes:");

// print hex values of bytes and (if printable), the char itself

char[] hex = "0123456789ABCDEF".toCharArray();

for (int i=0; i

int b = (bs[i] < 0) ? bs[i] + 256 : bs[i];

System.err.print(hex[b>>4] + "" + hex[b&0xf]

+ ( ! Character.isISOControl((char)b) ? ""+(char)b : ".")

+ ( (i%4 == 3) ? "\n" : " "));

}

System.err.println();

}

}

例如,以UTF-8运行时(在其他JVM默认编码下,FE和FF的字符显示会有所不同),输出为:

$ javac Test.java && java -cp . Test hello UTF-16

12 bytes:

FEþ FFÿ 00. 68h

00. 65e 00. 6Cl

00. 6Cl 00. 6Fo

$ javac Test.java && java -cp . Test hello UTF-16LE

10 bytes:

68h 00. 65e 00.

6Cl 00. 6Cl 00.

6Fo 00.

$ javac Test.java && java -cp . Test hello UTF-16BE

10 bytes:

00. 68h 00. 65e

00. 6Cl 00. 6Cl

00. 6Fo

2020-11-13

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值