定义:
CharSet是对java nio编码解码的解决方案,专门负责字符的编码和解码。
编码:字符数组、字符串 ===> 字节数组。
解码:字节数组 ==> 字符数组、字符串
API详解:
获取CharSet的API:
//创建一个charSet,传入字符集名称 比如utf-8
public static Charset forName(String charsetName)
//返回一个默认字符集的charset,UTF-8
public static Charset defaultCharset()
编码解码API
//解码,把字节缓冲区解码成字符缓冲区。
public final CharBuffer decode(ByteBuffer bb)
//编码。把字符缓冲区编码成字节缓冲区。
public final ByteBuffer encode(CharBuffer cb)
//编码。把字符串编码成字节缓冲区。
public final ByteBuffer encode(String str)
//返回一个解码器,用于专门进行解码。提供更多的功能。
public abstract CharsetDecoder newDecoder();
//返回一个编码器,用于专门进行编码。提供更多的功能。
public abstract CharsetEncoder newEncoder();
demo:
public static void testEnCodeDeCode(){
Charset UTF8CharSet = Charset.forName("utf-8");
Charset GBKCharSet = Charset.forName("gbk");
String content = "我贼帅!!";
ByteBuffer byteBuffer = UTF8CharSet.encode(content);
//用同样的字符集进行解码,不会乱码
System.out.println("=================>>>UTF8CharSet encode, UTF8CharSet decode<<<====================");
System.out.println(new String(UTF8CharSet.decode(byteBuffer).array()));
byteBuffer.clear();
//用不一样的字符集进行解码,乱码
System.out.println("=================>>>UTF8CharSet encode, GBKCharSet decode<<<====================");
System.out.println(new String(GBKCharSet.decode(byteBuffer).array()));
}
结果:

注意:
- 编码与解码要用一样的字符集,不然会造成乱码。
- 如果只是进行简单的编码解码,无需使用专用的编码器和解码器,在Charset中完成就好。
其他API:
//返回字符集的名字
public final String name()
//返回字符集的名字,与name()一样的效果。
public String displayName()
//返回是否支持传入参数charsetName代表的字符集
public static boolean isSupported(String charsetName)
//返回此字符集是否注册在 http://www.iana.org/assignments/character-sets IANA字符集注册表中。
public final boolean isRegistered();
//返回此字符集的别名的set集合。
public final Set<String> aliases()
//返回可用的字符集的集合。返回一个SortedMap结构,键是字符集名称,值是代表字符集的CharSet对象。
public static SortedMap<String,Charset> availableCharsets()
//判断两个字符集是否相等,0相等,返回非零不相等,其实就是比较字符集的名字。忽略大小写。
public final int compareTo(Charset that)
//返回此字符集是否支持编码。
public boolean canEncode()

本文深入探讨了Java NIO中的CharSet类,讲解了字符编码和解码的基本原理,包括编码解码API的使用,以及如何避免乱码问题。同时,文章提供了详细的demo示例,帮助读者理解CharSet在不同字符集之间的转换。
1217

被折叠的 条评论
为什么被折叠?



