正则表达式,在html标签上的应用

1,得到网页上的链接地址:
stringmatchString=@"<a[^>]+href=/s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>/s]+))/s*[^>]*>";
2,得到网页的标题:
stringmatchString=@"<title>(?<title>.*)</title>";
3,去掉网页中的所有的html标记:
stringtemp=Regex.Replace(html,"<[^>]*>","");//html是一个要去除html标记的文档
java中去掉网页中的所有标签
str=str.replaceAll("<[^>]*>","");
4,stringmatchString=@"<title>([/S/s/t]*?)</title>";

5,js去掉所有html标记的函数:
functiondelHtmlTag(str)
{
returnstr.replace(/<//?.+?>/g,"");//去掉所有的html标记
}
这个可能IE5会错,那用这个,梅花的:
functiondelHtmlTag(str)
{
returnstr.replace(/<[^>]+>/g,"");//去掉所有的html标记
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值