编码相关的封装类

本文介绍了一个实用的编码转换工具类CharsetUtil,它提供了多种字符集编码转换的方法,如US-ASCII、ISO-8859-1、UTF-8、UTF-16等。该工具类还支持中文超大字符集GBK的转换,以及Unicode和GBK之间的相互转换。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

package com.opslab.util;

import java.io.ByteArrayOutputStream;
import java.io.OutputStreamWriter;
import java.io.UnsupportedEncodingException;

/**
* Description:
* 编码相关的封装类
*/
public final class CharsetUtil {
/**
* 7位ASCII字符,也叫作ISO646-US、Unicode字符集的基本拉丁块
*/
public static final String US_ASCII = "US-ASCII";

/**
* ISO 拉丁字母表 No.1,也叫作 ISO-LATIN-1
*/
public static final String ISO_8859_1 = "ISO-8859-1";

/**
* 8 位 UCS 转换格式
*/
public static final String UTF_8 = "UTF-8";

/**
* 16 位 UCS 转换格式,Big Endian(最低地址存放高位字节)字节顺序
*/
public static final String UTF_16BE = "UTF-16BE";

/**
* 16 位 UCS 转换格式,Little-endian(最高地址存放低位字节)字节顺序
*/
public static final String UTF_16LE = "UTF-16LE";

/**
* 16 位 UCS 转换格式,字节顺序由可选的字节顺序标记来标识
*/
public static final String UTF_16 = "UTF-16";

/**
* 中文超大字符集
*/
public static final String GBK = "GBK";

/**
* 将字符编码转换成US-ASCII码
*/
public final static String toASCII(String str) throws UnsupportedEncodingException {
return changeCharset(str, US_ASCII);
}

/**
* 将字符编码转换成ISO-8859-1码
*/
public final static String toISO_8859_1(String str) throws UnsupportedEncodingException {
return changeCharset(str, ISO_8859_1);
}

/**
* 将字符编码转换成UTF-8码
*/
public static String toUTF_8(String str) throws UnsupportedEncodingException {
return changeCharset(str, UTF_8);
}

/**
* 将字符编码转换成UTF-16BE码
*/
public final static String toUTF_16BE(String str) throws UnsupportedEncodingException {
return changeCharset(str, UTF_16BE);
}

/**
* 将字符编码转换成UTF-16LE码
*/
public final static String toUTF_16LE(String str) throws UnsupportedEncodingException {
return changeCharset(str, UTF_16LE);
}

/**
* 将字符编码转换成UTF-16码
*/
public final static String toUTF_16(String str) throws UnsupportedEncodingException {
return changeCharset(str, UTF_16);
}

/**
* 将字符编码转换成GBK码
*/
public final static String toGBK(String str) throws UnsupportedEncodingException {
return changeCharset(str, GBK);
}

/**
* 字符串编码转换的实现方法
*
* @param str 待转换编码的字符串
* @param newCharset 目标编码
* @return
* @throws UnsupportedEncodingException
*/
public final static String changeCharset(String str, String newCharset) throws UnsupportedEncodingException {
if (str != null) {
// 用默认字符编码解码字符串。
byte[] bs = str.getBytes();
// 用新的字符编码生成字符串
return new String(bs, newCharset);
}
return null;
}

public final static String getDefaultCharSet() throws UnsupportedEncodingException {
OutputStreamWriter writer = new OutputStreamWriter(new ByteArrayOutputStream(), CharsetUtil.UTF_8);
String enc = writer.getEncoding();
return enc;
}

/**
* 字符串编码转换的实现方法
*
* @param str 待转换编码的字符串
* @param oldCharset 原编码
* @param newCharset 目标编码
* @return
* @throws UnsupportedEncodingException
*/
public final static String changeCharset(String str, String oldCharset,
String newCharset) throws UnsupportedEncodingException {
if (str != null) {
// 用旧的字符编码解码字符串。解码可能会出现异常。
byte[] bs = str.getBytes(oldCharset);
// 用新的字符编码生成字符串
return new String(bs, newCharset);
}
return null;
}

/**
* Unicode转换成GBK字符集
*
* @param input 待转换字符串
* @return 转换完成字符串
*/
public final static String toGBKWithUTF8(String input) throws UnsupportedEncodingException {
if (StringUtil.isEmpty(input)) {
return "";
} else {
String s1;
s1 = new String(input.getBytes("ISO8859_1"), "GBK");
return s1;
}
}

/**
* GBK转换成Unicode字符集
*
* @param input 待转换字符串
* @return 转换完成字符串
*/
public final static String toUnicodeWithGBK(String input) throws UnsupportedEncodingException {
if (StringUtil.isEmpty(input)) {
return "";
} else {
String s1;
s1 = new String(input.getBytes("GBK"), "ISO8859_1");
return s1;
}
}

}

转载于:https://www.cnblogs.com/chinaifae/p/10254794.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值