Java 字符串转换UTF-8

本文介绍了一个Java程序,该程序实现了字符串在UTF-16编码下的转换。通过两个方法charsetEncode和charsetDeCode,可以将汉字或其他字符转换为特定格式的十六进制表示,并能反向还原成原始字符串。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  汉字->6C49 5B57

 

public static void main(String[] args) {
	System.out.println(charsetEncode(汉字));
       
	System.out.println(charsetDeCode(charsetEncode(汉字)));
}
	

private String charsetEncode(String str) {
		if ("".equals(str)) {
			return "";
		}
		
		StringBuffer strBuff = new StringBuffer("");
		try {
			byte b[] = str.getBytes("UTF-16");
			for (int n = 0; n < b.length; n++) {
				str = (Integer.toHexString(b[n] & 0XFF));
				if (str.length() == 1) {
					strBuff.append("0").append(str);
				} else {
					strBuff.append(str);
				}
			}
			
			// 去除第一个标记字符
			str = strBuff.toString().toUpperCase().substring(4);
			// System.out.println(str);
			char[] chs = str.toCharArray();
			strBuff.delete(0, strBuff.length());
			for (int i = 0; i < chs.length; i = i + 4) {
				strBuff.append(chs[i])
				       .append(chs[i + 1])
				       .append(chs[i + 2])
				       .append(chs[i + 3])
				       .append(" "); 
			}
		} catch (Exception e) {
			System.out.print(e.getStackTrace());
			e.getStackTrace();
		}
		
		return strBuff.toString();
	}
	
	private String charsetDeCode(String str) {
		if ("".equals(str)) {
			return "";
		}
		
		StringBuffer sb = new StringBuffer("");
		str = str.replace(" ", "");
		try {
			for (int i =0; i < str.length()-3; i = i + 4){
				sb.append((char)Integer.valueOf(str.substring(i, i+4),16).intValue());
			}
		} catch (Exception e) {
			System.out.print(e.getStackTrace());
			e.getStackTrace();
		}
		
		return sb.toString();
	}


		String   str= "日本語";
		char   c=(char)str.charAt(0);
		System.out.println(c+ "===》: "+Integer.toString(c,16));
		System.out.println( "====: "+(char)Integer.valueOf(Integer.toString(c,   16),16).intValue());

 

 

 

 

### 将Java字符串转换UTF-8编码 在Java中,可以使用`getBytes()`方法来将字符串转换为指定编码的字节数组。对于将字符串转换UTF-8编码,可以通过传递参数`"UTF-8"`给此方法实现[^3]。 ```java public class StringToUtf8 { public static void main(String[] args) { try { String originalString = "Example"; byte[] utf8Bytes = originalString.getBytes("UTF-8"); System.out.println("Original String: " + originalString); System.out.print("UTF-8 Bytes: "); for (byte b : utf8Bytes) { System.out.printf("%02X ", b); } } catch (Exception e) { e.printStackTrace(); } } } ``` 如果需要处理可能存在的异常情况,应该捕获并处理`UnsupportedEncodingException`,因为并非所有的虚拟机都支持每种字符集。当尝试获取不被支持的字符集对应的字节表示时会抛出这个异常。 另外,在某些情况下,可能会遇到从其他编码格式(如ASCII或ANSI)到UTF-8转换需求。这种场景下也可以采用相同的方法,即通过调用带有适当编码名称作为参数的`getBytes()`函数完成转换操作[^1][^4]。 值得注意的是,虽然这里讨论的是将字符串转换UTF-8编码后的字节数组,但在实际应用中通常还需要考虑如何正确解码这些字节回到原始文本形式。这一般涉及到创建新的`String`对象,并指明其构造器应使用的源数据以及预期的目标编码方式: ```java String decodedString = new String(utf8Bytes, "UTF-8"); ``` 这样做能够确保即使经过多次编解码过程之后仍然能保持原有信息不变。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值