PHP 页面提取关键字和查找页面的所有链接

PHP与DOM文档操作

最新推荐文章于 2024-05-01 17:24:23 发布

最新推荐文章于 2024-05-01 17:24:23 发布 · 887 阅读

文章标签：

#PHP提取关键字 #PHP查找页面链接 #PHP

境-PHP2 专栏收录该内容

6 篇文章

订阅专栏

本文介绍了使用PHP获取网页元信息及利用DOMDocument解析HTML的方法。通过实例展示了如何抓取页面的元标签信息以及如何遍历页面中的所有链接。

<meta charset="utf-8">
<?php
$meta = get_meta_tags('http://onestopweb.iteye.com/blog/2330507');
$keywords = $meta['keywords'];
$keywords = explode(',', $keywords);
$keywords = array_map('trim', $keywords);
$keywords = array_filter($keywords);
print_r($keywords);
?>

效果图：

<meta charset="utf-8">
<?php
$html = file_get_contents('http://onestopweb.iteye.com/');
$dom = new DOMDocument();
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate("/html/body//a");
for ($i = 0; $i < $hrefs->length; $i++) {
	$href = $hrefs->item($i);
	$url = $href->getAttribute('href');
	echo $url.'<br />';
}
?>

效果图：