遇到了一个坑的问题:
public static void main(String[] args) {
// decodeUnicode("你");
System.out.println( test("你"));
}
public static String test(String stringToEscape){
// String escaped = StringEscapeUtils.escapeHtml3(stringToEscape);
// String escaped = StringEscapeUtils.escapeHtml3(stringToEscape);
// String escaped = StringEscapeUtils.unescapeHtml4(stringToEscape);
String escaped = StringEscapeUtils.unescapeHtml4(stringToEscape);
return escaped;
}
运行结果:

该程序并没有将对应的HTML实体字符集合转换成对应的java 原字符,
最后我查过了,很多都是这样实现的,思考过换过jar 等需求等,发现最后都是于是无补。
无疑中检查我的输出竟然少了个; 号,才造成这样的结果,
添加个分号,搞定。

本文探讨了Java中HTML实体的解码问题,通过一个简单的示例程序展示了如何使用StringEscapeUtils.unescapeHtml4方法进行HTML实体的解码,并强调了在解码过程中正确处理HTML实体的重要性。
1472

被折叠的 条评论
为什么被折叠?



