特定需求下,需要过滤大于3个字节以上的字符。
在JAVA中 UTF-8编码下大于3字节的字符占两个Character字符,JDK的API中String.codePointAt可以检测到超过3字节的字符再作相应过滤。
/**
* 过滤UTF-8编码中超过3个字节的字符
* @param testStr
* @return
*/
public static String twoCharUtf8Filter(String testStr){
StringBuilder sb = new StringBuilder();
for