[b][color=red]原创文章:转载请注明出处[/color][/b]
这是提取表格内容的一个小例子。不用解释了,能看懂的。呵呵
try {
Parser parser=new Parser("http://detail.zol.com.cn/260/259165/param.shtml");
// NodeFilter nodeFilter=new HasAttributeFilter("","");
HtmlPage htmlPage=new HtmlPage(parser);
parser.visitAllNodesWith(htmlPage);
TableTag tableTags[] =htmlPage.getTables();
for(TableTag tableTag:tableTags){
TableRow tableRows[]=tableTag.getRows();
for(int i=0;i<tableRows.length;i++){
System.out.println("----------------------");
TableColumn tableColumns[]=tableRows[i].getColumns();
for(int j=0;j<tableColumns.length;j++){
System.out.println(tableColumns[j].toPlainTextString());
}
}
}
} catch (ParserException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
这是提取表格内容的一个小例子。不用解释了,能看懂的。呵呵
本文介绍了一个使用Java代码抓取ZOL网站产品参数页面中的表格数据的方法。通过创建Parser实例并设置URL,利用HtmlPage类解析网页,再遍历提取所有表格及其单元格内容。
1040

被折叠的 条评论
为什么被折叠?



