Jsoup使用总结

Jsoup是对网页进行解析的工具:

首先通过网页地址获取网页的数据(String格式),然后就是使用jsoup将进行对结点解析:
//解析html成Document
public static Document getDocument(String html){
Document doc = Jsoup.parse(html);
return doc;
}
//这是三个节点:超链接,图片地址,还有p是段落的标签,我就做了三个,其他可以百度
public class HtmlSelector {
public static String href = “a”;
public static String img = “img[src]”;
public static String p = “p”;
}

//解析Doc,htmlSelector 是HtmlSelector中的参数
public static Elements getElement(Document doc,String htmlSelector ){
Elements links = doc.select(htmlSelector );
return links;
}
//提供获取超链接的模板,其他类似,都是根据attr(arg)方法,对于img标签获取图片地址是attr(src),p标签更简单直接用text()方法就可以获取其中的文字
public static List getData(Document doc){
List list = new ArrayList();
Elements href = getElement(doc,HtmlSelector.href);
for (Element e1:href){
YelloObj ye = new YelloObj();
//只要超链接,在上下页用到
String h = e1.attr(“href”);
String t = e1.text();
//Log.e(“Main”, “获取的文字: “+t);
if (h.endsWith(“.htm”)) {
ye.setYelloHref(h);
ye.setYelloText(t);
list.add(ye);
}
return list;

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值