
Java Htmlparser
蛰伏神兽
.0.0.....0.0.0.0..0.00...............
展开
-
htmlparser源码简单分析
Htmlparser 源代码分析 一.根目录下的类 1.Attribute.java 属性类,四个field:mName,mAssignment,mValue,mQuote; 空白标签时:mName=null 除了 ' , " 两引号和自定义参数字符表示的分隔号外,mQuote 的值都以 char 类型的0 字符表示。 其中的get原创 2012-02-12 09:52:51 · 3268 阅读 · 0 评论 -
HtmlParser 错误解决 character mismatch (new: [] != old: []) for encoding change from ...
错误: character mismatch (new: 军 [0x519b] != old: [0xbe¾]) for encoding change from ISO-8859-1 to GB2312 at character offset 186。 原因: 如果请求url返回的页面上中文的title写在了meta的前面,而且这个meta里设置的charset编码信息又和parse原创 2012-02-14 15:12:51 · 3867 阅读 · 7 评论