天气小偷程序

本文提供了一个使用PHP进行网页抓取的实例,包括从百度获取天气信息及搜狐新闻标题链接等内容。通过具体代码展示了如何利用PHP的file_get_contents及正则表达式preg_match_all等函数实现数据抓取。

例子,php百度天气小偷程序。
 

复制代码代码如下:

<?php
//获取在百度里面搜索 xx(地名)天气 抓取的天气信息
$url = "http://www.baidu.com/s?wd=%B1%B1%BE%A9%CC%EC%C6%F8"; //此为在百度里搜 北京天气 的返回地址
$content = file_get_contents($url);
preg_match_all('/<div id="weat">(.+?)<\/table>/si',$content,$temp);
preg_match_all('/<td>(.+?)<\/td>/si',$temp[1][0],$temp1);
var_dump ($temp1[1][0]);

 

输出信息:

string(243) "北京天气
今天:温度22℃ - 24℃。白天:多云, 大阵雨,夜间:多云。东风2级转1-2级
明天:温度23℃ - 28℃。白天:多云,夜间:多云。东南风2级"

 

index.php

<?php

$con = file_get_contents("http://it.sohu.com/s2010/5651/s274087241/index.shtml");
$preg="/·<a href=(.*) target=_blank>(.*)<\/a>/U";
preg_match_all($preg,$con,$arr);
foreach($arr[1] as $id=>$v){
echo "<a href=view.php?url=$v>".$arr[2][$id]."</a><br>";
}
?>
 

view.php

<?php

$con = file_get_contents($_GET[url]);
$preg="/<h1>(.*)<\/h1>/";
preg_match($preg,$con,$arr);
echo "<h1>".$arr[1]."</h1>";
echo "<hr>";
$preg2="/<div class=\"text clear\" id=\"contentText\" collection=\"Y\">(.*)<\/div>/s";
preg_match($preg2,$con,$arr2);
echo $arr2[1];

?>

 

转载于:https://my.oschina.net/afengzxf/blog/831078

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值