利用php实现最简单的爬虫
在此之间需要验证你的环境是否有打开curl,是否对其支持。
代码很简单,就三行(因为是最简单的,并没有做其他处理)
$curl = curl_init("http://www.baidu.com");
curl_exec($curl);
curl_close($curl);
最简单的以爬取百度的首页为例,之后在命令行中输入
php -f test01.php
结果如下:
百度网页的html代码
最后为了可以看得方便,我们将其重定向到该文件夹下面的一个html中,命令如下:
php -f test01.php > baidu.html
然后用浏览器打开即可