php采集百度下面的相关搜索关键词

本文介绍了一个PHP网站抓取与数据解析的小功能,包括如何使用curl获取网页内容,利用正则表达式匹配并提取所需信息,并对提取的数据进行清理与格式化输出。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 1 <?php
 2 
 3 $html = getArray('狂怒');
 4 $res = getHtmlByContent($html);
 5 print_r($res);
 6 
 7 
 8 
 9 /**
10  * getHtmlByContent 
11  * 
12  * @param mixed $html 
13  * @access public
14  * @return void
15  */
16 function getHtmlByContent($html){
17     preg_match_all('/<table cellpadding="0">.*<\/table>/',$html,$res);
18 //  print_r($res[0][0]);
19     preg_match_all('/<th>.*?<\/th>/',$res[0][0],$result);
20     $result = $result[0];
21     if(!empty($result) && is_array($result)){
22         foreach($result as $k=>$v){
23             $result[$k] = strip_tags($v);
24         }   
25     }   
26     //print_r($result);
27     return $result;
28 }
29 
30 
31 /**
32  * getArray 
33  * 
34  * @param mixed $kw 
35  * @access public
36  * @return void
37  */
38 function getArray($kw){
39     $url="http://www.baidu.com/s?wd=".$kw;
40     $curl=curl_init();
41     curl_setopt($curl,CURLOPT_URL,$url);
42     curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);
43     //curl_setopt($curl, CURLOPT_POSTFIELDS, $curlPost);
44     $data = curl_exec($curl);
45     $data = preg_replace("/[\r\n\t]+/","",$data);
46     return $data;
47 
48 }

自己网站需要的一个小功能,有需要的可以参考下。

转载于:https://www.cnblogs.com/coffiasd/p/4208624.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值