php抓取网页匹配内容模板

本文展示了一个使用PHP编写的简单爬虫程序示例,该程序用于从百度搜索引擎抓取包含特定关键词的内容页面。通过设置curl选项并使用正则表达式来解析网页,程序能够有效地抓取和显示搜索结果。
<?php
  set_time_limit(0);
  $url="http://wap.baidu.com/s?word=site%3Apan.baidu.com+intitle%3A%E5%85%8D%E8%B4%B9%E9%AB%98%E9%80%9F"; //百度搜索结果
  $ch=curl_init();
  curl_setopt($ch,CURLOPT_HEADER,false);
  curl_setopt($ch,CURLOPT_URL,$url);
  curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
  $content=curl_exec($ch);
  curl_close($ch);
  preg_match_all('/<div class="resitem"(.*)<\/div>/iUs',$content,$text);//用正则表达式匹配搜索结果
  //var_dump($text);
  foreach ($text[0] as $key) 
  {
    echo $key."<br>";
  }
?>

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值