提取出一篇文章里面的所有图片代码

本文介绍了一种从HTML内容中提取图片路径的VBScript实现方法。通过使用正则表达式解析HTML源码,该方法能够准确地找到并返回所有图片的路径。适用于需要批量处理HTML文档提取图片的应用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

提取一段字符串的图片文件,当有多张图片时,用“|”来分隔,可以用数组来获取


Function GetImagesInContent(strContent)
Set zk = Server.CreateObject("ZKLib.ZKComLib")
Set re=new RegExp
re.IgnoreCase =True
re.Global=false
MaxLoopCount = 5
s = strContent

strImageList = ""
LoopCount=0
re.Pattern = "(^[sS]*)<IMG.*src=""([^""]*)""([sS]*)"
Test=re.Test(s)
If Test Then

Do While Test
imgPath = re.Replace(s,"$2")
strImageList = strImageList & imgPath
s=re.Replace(s,"$1")

Test=re.Test(s)
LoopCount=LoopCount+1
If Test Then
strImageList = strImageList & "|"
End If
zk.SleepEx(10)
If LoopCount>20 Then Exit Do
Loop
End If
Set re = Nothing
Set zk = Nothing
GetImagesInContent = strImageList
End Function
'------------------------------------------------------------------------------------------
'--------------------------------------------------------------------
'提取一段字符串的图片文件
Function getphoto(strHTML)
Dim objRegExp, Match, Matches,tp
Set objRegExp = New Regexp
objRegExp.IgnoreCase = True
objRegExp.Global = True
objRegExp.Pattern = "<img.+?>"
tp=""
Set Matches = objRegExp.Execute(strHTML)
For Each Match in Matches
tp=tp& Match.value
Next
getphoto=tp
Set objRegExp = Nothing
End Function
Function getsrc(strHTML)
Dim objRegExp, Match, Matches,tp
Set objRegExp = New Regexp
objRegExp.IgnoreCase = True
objRegExp.Global = True
objRegExp.Pattern = "src=.+?["&chr(34)&chr(32)&">]"
tp=""
Set Matches = objRegExp.Execute(Replace(Lcase(strHTML),chr(39),chr(34)))
For Each Match in Matches
tp=tp&"|$$|"  & cutsrc(Trim(Match.value))
Next
getsrc=tp
Set objRegExp = Nothing
End Function
function cutsrc(strHtml)
   if Left(strHtml,5)="src="&chr(34) then
      cutsrc=Trim(mid(strHtml,6,len(strHtml)-6))
   else
      if Right(strHtml,1)=">" then
      cutsrc=Trim(mid(strHtml,5,len(strHtml)-5))
   else
      cutsrc=Trim(mid(strHtml,5,len(strHtml)-4))
      end if
   end if
end function
Response.Write getsrc(getphoto(shujv))
### 如何找到文章图片的来源 要定位一篇文章中使用的图片的具体处,可以采用多种方法和技术手段来实现这一目标。以下是几种常见的解决方案: #### 使用以图搜图工具 通过使用专门设计用于识别和追踪图片处的搜索引擎或工具,能够有效查找图片的原始来源[^2]。这些工具有助于分析一张图片在网络上的分布情况以及其最早现的位置。 对于国际范围内的查询需求来说,Google Images 和 TinEye 是两个非常强大的选项;它们支持上传本地文件或者直接输入URL地址来进行反向图像搜索操作。特别是TinEye以其独特的算法著称,在处理高度修改过的版本时表现尤为突。 在国内环境下,则可以选择百度识图、360快照等功能相似的服务平台完成相应任务。尽管相较于国外同类产品可能存在一定差距,但对于日常生活中遇到的一些简单场景——比如寻找明星照片原版、动漫角色设定稿等——依然具备足够的实用价值。 #### 自动化脚本辅助提取 如果面对的是批量性的需求(例如整个网站上所有嵌入式资源),那么编写一段简单的爬虫程序配合OCR文字识别技术将是更为高效的选择之一。利用Python语言结合第三方库requests获取网页源码后解析其中img标签属性href指向链接即可得到目标素材位置信息列表[^1]。 另外值得注意的一点在于某些特殊情况下可能还需要额外考虑防盗链机制的影响因素。此时可以通过设置合理的headers参数模拟真实用户的访问行为规避此类限制条件影响正常抓取流程[^3]。 ```python import requests from bs4 import BeautifulSoup url = 'your_target_webpage_url' response = requests.get(url, headers={'User-Agent': 'Mozilla/5.0'}) soup = BeautifulSoup(response.text, 'html.parser') images = soup.find_all('img') for img in images: src = img['src'] print(src) ``` 上述代码片段展示了基本原理框架结构,实际应用过程中还需根据具体情况调整细节部分逻辑内容。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值