前几天用htmlparser作页面解析的时候, 遇到了InputStream乱码、丢开头符号的问题。找了很多方法都没能解决。
终于在一个国外论坛上找到了一个目前看来很不错的解决方法。
private String streamToString(InputStream inputHtml) throws IOException {
StringBuffer out = new StringBuffer();
byte[] b = new byte[4096];
for (int n; (n = inputHtml.read(b)) != -1;) {
out.append(new String(b, 0, n));
}
return out.toString();
}
终于在一个国外论坛上找到了一个目前看来很不错的解决方法。
private String streamToString(InputStream inputHtml) throws IOException {
StringBuffer out = new StringBuffer();
byte[] b = new byte[4096];
for (int n; (n = inputHtml.read(b)) != -1;) {
out.append(new String(b, 0, n));
}
return out.toString();
}
本文分享了一种解决使用htmlparser进行页面解析时遇到的InputStream乱码及丢开头符号问题的有效方法。通过自定义流读取函数streamToString,能够正确处理不同大小的数据块并避免乱码出现。
1425

被折叠的 条评论
为什么被折叠?



