利用php实现最简单的爬虫

本文介绍了一种使用PHP实现的简单爬虫方案,通过curl函数获取了百度首页的HTML源码,并展示了如何将爬取结果输出到本地HTML文件中。

利用php实现最简单的爬虫

  在此之间需要验证你的环境是否有打开curl,是否对其支持。
代码很简单,就三行(因为是最简单的,并没有做其他处理)

$curl = curl_init("http://www.baidu.com");
curl_exec($curl);
curl_close($curl);

最简单的以爬取百度的首页为例,之后在命令行中输入

php -f test01.php

结果如下:
这里写图片描述

百度网页的html代码

最后为了可以看得方便,我们将其重定向到该文件夹下面的一个html中,命令如下:

php -f test01.php > baidu.html

这里写图片描述

然后用浏览器打开即可

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值