php爬虫之有道词典获取词条信息

本文介绍了一个使用PHP实现的简单网页爬虫,通过POST请求提交搜索关键词至百度,并抓取返回的搜索结果页面。代码中展示了如何利用cURL进行HTTPS请求,设置请求头,处理重定向以及获取和打印响应内容。

文件目录
在这里插入图片描述
first.php

<!DOCTYPE html>
<html>
<body>
	<form action="php/baidu.php" method="post">
		<input type="text" name="search_text" id="search_text" value="请输入您要搜索的内容" />
	<input type="submit" name="search" id="search" value="百度一下" />
	</form>
</body>
</html>

baidu.php

<?php
echo $_POST['search_text'];	
$url = "http://www.youdao.com/w/".$_POST['search_text']."/#keyfrom=dict2.top";//要爬取的网址

echo $url;
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt ($ch,  CURLOPT_HEADER,false);
    curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
    curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
	//设置用户代理(后缀为.top的网址不加这个获取不到内容。)
	curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.22 (KHTML, like Gecko) Chrome/25.0.1364.172 Safari/537.22");

	//关闭直接输出
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
	//加入重定向处理
	curl_setopt($ch, CURLOPT_FOLLOWLOCATION ,1); 
    $response = curl_exec($ch);	
	
	echo curl_errno($ch);	
	
	echo($response);
	curl_close($ch);
?>

运行结果
在这里插入图片描述

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值