Java注释代码也会执行之Unicode编码解码

原创已于 2022-03-19 16:39:07 修改 · 4.6k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#java #unicode编码 #unicode解码 #注释中含有unicode #java解惑

于 2022-03-19 05:00:00 首次发布

Java 专栏收录该内容

20 篇文章

订阅专栏

在整理Java知识点时遇到一个问题，注释中的非法Unicode转义导致编译失败。通过深入研究发现，Java注释中u后面必须跟随4个16进制数字才有效。文章介绍了如何使用Apache Commons Lang的StringEscapeUtils进行Unicode编码和解码，并提醒开发者在注释中使用\u进行转义以避免问题。

整理Java知识点时，在注释中一次无意的书写，导致编译失败，竟然报“非法的Unicode转义”。本着IT人钻研的精神，促使自己有必要深入了解Unicode编码解码的正确用法。

1、Unicode编码解码

// 把Java中\u格式的unicode编码转成中文
String context = "把Java中\\u格式的unicode编码转成中文";

// 编码（转换为Unicode） org.apache.commons.lang.StringEscapeUtils#escapeJava(String)
String escapeContext = StringEscapeUtils.escapeJava(context);
System.out.println(escapeContext);

// 解码（将Unicode还原为ASCII） org.apache.commons.lang.StringEscapeUtils#unescapeJava(String)
System.out.println(StringEscapeUtils.unescapeJava(escapeContext));