如题: 写段php代码: 实现每隔1个小时,自动更新采集http://top.baidu.com/buzz/top10.html里面的关键字,将关键字用“|”分割写入到txt文件中。 要求完整可用, 谢谢!
txt 写入是覆盖方式, 意义就是更新里面的关键字。
<?php
$str_buff = @file_get_contents("http://top.baidu.com/buzz/top10.html");
preg_match_all("/<td class=\"key\"><a href=\"(.*)\" target=\"_blank\">(.[^<]*)<\/a><\/td>/i", $str_buff, $arr_infos);
@file_put_contents("info.txt", implode("|",$arr_infos[2]));
?>
每个1小时执行可以用windows的task schedule或linux的crontab按时调用就可以了。
本文介绍了一段PHP代码,用于每小时自动抓取百度热门关键词榜单,并将获取到的关键词以“|”分隔符的形式写入TXT文件中进行更新。此脚本利用正则表达式从网页中提取关键词。

被折叠的 条评论
为什么被折叠?



