1. 取得指定网页內的所有图片:
<?php
//取得指定位址的內容,並储存至text
$text=file_get_contents('http://yourweb/');
//取得第一個img标签,並储存至阵列match(regex语法与上述同义)
preg_match('/<img[^>]*>/Ui', $text, $match);
//打印match
print_r($match);
-----------------
2. 取得指定网页內的第一张图片:
<?php
//取得指定位址的內容,並储存至text
$text=file_get_contents('http://yourweb/');
//取得第一個img标签,並储存至阵列match(regex语法与上述同义)
preg_match('/<img[^>]*>/Ui', $text, $match);
//打印match
print_r($match);
------------------------------------
3. 取得指定网页內的特定div区块(藉由id判断):
<?php
//取得指定位址的內容,並储存至text
$text=file_get_contents('http://yourweb/');
//去除換行及空白字元(序列化內容才需使用)
$text=str_replace(array("\r","\n","\t","\s"), '', $text);
//取出div标签且id為PostContent的內容,並储存至阵列match
preg_match('/<div[^>]*id="PostContent"[^>]*>(.*?) <\/div>/si',$text,$match);
//打印match[0]
print($match[0]);
-------------------------------------------
4. 上述2及3的结合:
<?php
//取得指定位址的內容,並储存至text
$text=file_get_contents('http://yourweb/');
//取出div标签且id為PostContent的內容,並储存至阵列match
preg_match('/<div[^>]*id="PostContent"[^>]*>(.*?) <\/div>/si',$text,$match);
//取得第一個img标签,並储存至阵列match2
preg_match('/<img[^>]*>/Ui', $match[0], $match2);
//打印match2[0]
print_r($match2[0]);
这篇博客介绍了如何使用PHP抓取网页上的特定图片和包含特定ID的div区块内容。通过`file_get_contents`获取网页源码,然后利用正则表达式`preg_match`匹配`<img>`标签和具有指定ID的`<div>`标签,从而实现目标内容的提取。
7033

被折叠的 条评论
为什么被折叠?



