
HtmlParser
hymcn
不甘平庸,不耐寂寞,记录生活的点点滴滴,希望每天进步一点点。
展开
-
htmlpaser打造个性化的爬虫程序 第二天
任务1: 抽取页面中的所有链接 LinkBean lb = new LinkBean (); lb.setURL ("http://sthaboutme.sinaapp.com/"); URL[] urls = lb.getLinks (); for (int i = 0; i < urls.lengt原创 2012-04-11 16:11:08 · 519 阅读 · 0 评论 -
htmlpaser打造个性化的爬虫程序 第三天
任务描述:文本内容抽取 /* * 通过tag名称和attribute名称来抽取文本 * @author hym */ public static String getTextByTagNameAndAttributeName(final String tagName,final String attributeName) { String temp = ""; tr原创 2012-04-11 21:41:47 · 630 阅读 · 0 评论