过滤掉xml文档不识别的字符
表中字段x_contact_method内容是:7986555 986567
System.out.println(rs.getString("x_contact_method"));输出结果是:
7986555(注:此处是空白方框乱码)986567
中文输出正常。
我想用replaceAll("[\\r\\n]",",")把空白方框乱码替换掉,匹配不到这个字符,怎么匹配到这个字符?
String x_contact_method = rs.getString("x_contact_method");
System.out.println(x_contact_method);
java.util.regex.Pattern INVALID_XML_CHARS = Pattern.compile("[^\\u0009\\u000A\\u000D\\u0020-\\uD7FF\\uE000-\\uFFFD\uD800\uDC00-\uDBFF\uDFFF]");
x_contact_method = INVALID_XML_CHARS.matcher(x_contact_method).replaceAll(" ");
if(x_contact_method!=null){
x_contact_method = x_contact_method.replaceAll("[\\r\\n]",",");//去除有可能有换行的字段。否则出错。
x_contact_method = x_contact_method.replaceAll("\"","'");//去除有可能有双引号的字段。否则出错
}
参考:http://stackoverflow.com/questions/93655/stripping-invalid-xml-characters-in-java
总结:学好英语,利用好谷歌,解决疑难问题不再是问题。
本文讨论了如何在Java中过滤XML文档中的不识别字符,并提供了使用正则表达式进行字符替换的方法,包括去除空白方框乱码、换行符及双引号等常见问题。
1665

被折叠的 条评论
为什么被折叠?



