提取Html内容中的所有图片信息

本文介绍了一种使用正则表达式从HTML内容中提取图片URL的方法,并提供了具体的C#实现代码。通过两个正则表达式分别匹配HTML中的img标签及图片链接,将匹配到的图片地址存储在ArrayList中返回。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

源码如下

protected ArrayList  GetAList(string HtmlContent)
  {
   try
   {
    ArrayList arr = new ArrayList();
    HtmlContent = content.Replace("/r/n","");
    HtmlContent = content.Trim();

    string partern = @"/<img(.*?)/>";//@"<a (.*)>.*</a> ";//"<a.*(?=Headline)(.|/n)*?</a>";//@"/<a (.*)>.*<///a>/ ";  


    System.Text.RegularExpressions.Regex regex = new System.Text.RegularExpressions.Regex(partern, System.Text.RegularExpressions.RegexOptions.IgnoreCase);
    
  
    System.Text.RegularExpressions.MatchCollection mc = regex.Matches(HtmlContent);
   
    if(mc.Count <= 0)
     return arr;        
    System.Text.RegularExpressions.Regex  regex2 = new System.Text.RegularExpressions.Regex(@"('|""|/)?[/w_()]*(.jpg|.bmp|.gif|.png|.jpeg)",System.Text.RegularExpressions.RegexOptions.IgnoreCase);
    
    foreach(Match m in mc)
    {
     System.Text.RegularExpressions.MatchCollection m2 = regex2.Matches(m.ToString());
     if( m2.Count > 0 )
     {      
      arr.Add( m2[0].ToString().Substring(1) );      
     }
    }
    return arr;    
     
   }
   catch(Exception ex)
   {
    throw ex;
   }

  }

 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值