抓取的另外思路

最新推荐文章于 2025-11-13 12:36:35 发布

原创最新推荐文章于 2025-11-13 12:36:35 发布 · 127 阅读

0 ·

CC 4.0 BY-SA版权

htmlparser 专栏收录该内容

1 篇文章

订阅专栏

public String getContent(String weburl) throws Exception {
  // TODO Auto-generated method stub
  NodeList nodelist = null;
  String temp = "";
  List list = new ArrayList();
  Parser parser = new Parser(weburl);
  //System.out.println("getUrl" + weburl);
  // System.out.println(parser.getEncoding());
  parser.setEncoding(parser.getEncoding());
  NodeFilter filterTable = new TagNameFilter("div");
  NodeFilter filterHeight = new HasAttributeFilter("class", "newsCon");
  NodeFilter filterClass = new HasAttributeFilter("id", "IDNewsDtail");
  NodeFilter filter = new AndFilter(new NodeFilter[] { filterTable,
  filterHeight, filterClass });
  nodelist = parser.extractAllNodesThatMatch(filter);
  System.out.println(nodelist.toHtml());

    // System.out.println("*******"+temp);
    return temp;
}