php curl 代理 抓取数据

本文介绍了一种使用PHP的多线程并发获取多个网页内容的方法,包括设置代理服务器和参数配置,以及如何实现非阻塞式获取。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

<?php
define ( 'IS_PROXY', true ); //是否启用代理
function async_get_url($url_array, $wait_usec = 0)
{
    if (!is_array($url_array))
        return false;

    $wait_usec = intval($wait_usec);

    $data    = array();
    $handle  = array();
    $running = 0;

    $mh = curl_multi_init(); // 开启多线程

    $i = 0;
    foreach($url_array as $url) {
        $ch = curl_init();
		if (IS_PROXY) {
		//以下代码设置代理服务器
		//代理服务器地址http://www.cnproxy.com/proxy1.html  !!Hong Kong, China的速度比较好
		curl_setopt ($ch, CURLOPT_PROXY,'110.4.12.170:80' );
		}
        curl_setopt($ch, CURLOPT_URL, $url);
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); // return don't print
        curl_setopt($ch, CURLOPT_TIMEOUT, 30); //设置超时时间
        curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)');
        curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); // 302 redirect
        curl_setopt($ch, CURLOPT_MAXREDIRS, 7); //HTTp定向级别
        curl_multi_add_handle($mh, $ch); // 把 curl resource 放进 multi curl handler 里
        $handle[$i++] = $ch;
    }

    /* 执行 */
	do {
	
		$mrc = curl_multi_exec($mh, $running);
		if ($wait_usec > 0) /* 每个 connect 要间隔多久 */
            usleep($wait_usec); // 250000 = 0.25 sec
	} while ($mrc == CURLM_CALL_MULTI_PERFORM);

	while ($running && $mrc == CURLM_OK) {
		if (curl_multi_select($mh) != -1) {
			do {
				$mrc = curl_multi_exec($mh, $running);
			} while ($mrc == CURLM_CALL_MULTI_PERFORM);
		}
	}


    /* 读取资料 */
    foreach($handle as $i => $ch) {
        $content  = curl_multi_getcontent($ch);
        $data[$i] = (curl_errno($ch) == 0) ? $content : false;
    }

    /* 移除 handle*/
    foreach($handle as $ch) {
        curl_multi_remove_handle($mh, $ch);
    }
	
    curl_multi_close($mh);

    return $data;
}

$urls = array('http://map.baidu.com');
$re = async_get_url($urls); 
echo $re[0];
?> 

转自:http://hi.baidu.com/ylj798/item/322468136b70bc433a176efc

http://www.oschina.net/code/snippet_80475_6689

curl入门:http://www.chinaz.com/program/2010/0119/104346_5.shtml

免费代理服务器:http://www.cnproxy.com/proxy1.html


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值