<meta charset="utf-8">
<?php
$meta = get_meta_tags('http://onestopweb.iteye.com/blog/2330507');
$keywords = $meta['keywords'];
$keywords = explode(',', $keywords);
$keywords = array_map('trim', $keywords);
$keywords = array_filter($keywords);
print_r($keywords);
?>
效果图:
<meta charset="utf-8">
<?php
$html = file_get_contents('http://onestopweb.iteye.com/');
$dom = new DOMDocument();
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate("/html/body//a");
for ($i = 0; $i < $hrefs->length; $i++) {
$href = $hrefs->item($i);
$url = $href->getAttribute('href');
echo $url.'<br />';
}
?>
效果图:
PHP与DOM文档操作
本文介绍了使用PHP获取网页元信息及利用DOMDocument解析HTML的方法。通过实例展示了如何抓取页面的元标签信息以及如何遍历页面中的所有链接。
424

被折叠的 条评论
为什么被折叠?



