正则表达式(根据Tag查询Html内容)

本文介绍了一种使用正则表达式从HTML中提取Title标签内容的方法,并提供了完整的Java代码实现。通过该方法可以有效地抓取网页的标题信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

使用正则表达式查询一段Html中的Title标签,包括内容!!



import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Test {

public static void main(String args[]) {
String html = "<title fdsafdsa>ABCD<hrf></title>gsdggas<title>ggds</title>jkll<title fdfdsa>005</title>";
List resultList = getContextByTag(html,"title");
for (Iterator iterator = resultList.iterator(); iterator.hasNext();) {
String context = (String) iterator.next();
System.out.println(context);
}
}

public static List getContextByTag(String html,String tag) {
String reg="<"+tag+"(([^<|^>|.]*>)|( >)).*?</"+tag+">";
List resultList = new ArrayList();
Pattern p = Pattern.compile(reg);
Matcher m = p.matcher(html );
while (m.find()) {
resultList.add(m.group());
}
return resultList;
}
}


结果:

<title fdsafdsa>ABCD<hrf></title>
<title>ggds</title>
<title fdfdsa>005</title>

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值