c#正则获取html里面a标签href的值

本文介绍如何使用C#中的正则表达式从HTML代码中提取a标签的href属性值,包括获取单个及多个链接的方法,并展示了针对特定文件类型链接的匹配方式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

获取单个a中href的值:

 

string str = "<a href=\"http://www.itsve.com\">下载</a>";
            string reg = @"<a[^>]*href=([""'])?(?<href>[^'""]+)\1[^>]*>";
            var item = Regex.Match(str, reg, RegexOptions.IgnoreCase);
            Console.WriteLine(item.Groups["href"].Value);

 

获取多个a中的href的值:

 

string str = "<!DOCTYPE html PUBLIC \"-//W3C//DTD XHTML 1.0 Transitional//EN\" \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\">"
                + "<html xmlns=\"http://www.w3.org/1999/xhtml\">"
                + "<head>"
                + "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\"/>"
                + "<meta content=\"怎样用c 正则表达式解析HTML中a 超链接 址 .NET技术 ASP.NET\" name=\"Keywords\"/>"
                + "<meta content=\"是用c 正则表达式 是在后台 不是js正则表达式 是要获取a href属性值\" name=\"description\"/>"
                + "<title>怎样用c#正则表达式解析HTML中a的超链接地址 - .NET技术 / ASP.NET</title>"
                + "<li><a href=\"http://news.youkuaiyun.com/\" target=\"_blank\">资讯</a>|</li>"
                + "<li><a href=\"http://mobile.youkuaiyun.com/\" target=\"_blank\">移动</a>|</li>"
                + "<li><a href=\"http://cloud.youkuaiyun.com/\" target=\"_blank\">云计算</a>|</li>"
                + "<link href=\"http://c.youkuaiyun.com/bbs/t/5/t5.css\" rel=\"stylesheet\" type=\"text/css\" />"
                + "<link href=\"http://www.youkuaiyun.com/images/favicon.ico\" rel=\"SHORTCUT ICON\" />";
            Regex reg = new Regex(@"(?is)<a[^>]*?href=(['""\s]?)(?<href>[^'""\s]*)\1[^>]*?>");
            MatchCollection match = reg.Matches(str);
            foreach (Match m in match)
            {
                Response.Write(m.Groups["href"].Value + "<br/>");
            }

 

//C#使用正则表达式获取HTML代码中a标签里包含指定后缀的href的值,表达式如下:

Regex regImg = new Regex(@"(?is)<a[^>]*?href=(['""\s]?)(?<href>([^'""\s]*\.doc)|([^'""\s]*\.docx)|([^'""\s]*\.xls)|([^'""\s]*\.xlsx)|([^'""\s]*\.ppt)|([^'""\s]*\.txt)|([^'""\s]*\.zip)|([^'""\s]*\.rar)|([^'""\s]*\.gz)|([^'""\s]*\.bz2))\1[^>]*?>"

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值