读取html中的超链接

博主工作中需读取字符串中的超链接,最初想通过获取字符串中的“<”“>”辨别,后发现不可行,转而求助正则表达式。文中介绍了字符串中超链接的几种类型,如跳转到网址、打电话、短信、邮件等,还提及了代码实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近在工作中需要读取字符串中的超链接,本来是想通过获取字符串中的"<"、">"来辨别超链接,但是随着考虑的场景越全面,越发觉得自己的想法很蠢,只好求助于正则表达式(其实正则表达式是一个我一直不想接触的东东,感觉太复杂了,但它的确很强大,这一次硬着头皮学习了解了一下)。

首先看下字符串中的超链接是什么样的?

1,跳转到网址:

<a href="www.baidu.com">百度一下,你就知道</a>

2.打电话:

<a href="tel:10086">10086</a>

3.短信

<a href="sms:10086">给10086发短信</a>
<a href="sms:10086?body=cxye">给 10086 发送内容为"cxye"的短信</a><br />
<a href="sms:10086,10010?body=cxye">给 10086 和 10010 发送内容为"cxye"的短信</a>

4.邮件

<a href="mailto:test1@163.com">mail</a>
<a href="mailto:test1@163.com,test2@163.com">mail</a>

代码实现

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class PatternTest {
    static String content = "<a href=\"www.baidu.com\">百度一下,你就知道</a>";
    static String pattern = "<[Aa]\\s+href\\s*=\\s*['\"](.+?)['\"]>(.+?)</[Aa]>";

    public static void main(String[] args) {
        Pattern p = Pattern.compile(pattern);
        Matcher m = p.matcher(content);

        while(m.find()) {
            System.out.println("gourp0 : " + m.group(0) + " group1 : " + m.group(1) + " group2 : " + m.group(2));
        }
    }

}

打印内容:

gourp0 : <a href="www.baidu.com">百度一下,你就知道</a> group1 : www.baidu.com group2 : 百度一下,你就知道
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值