file_get_contents 小结

本文介绍了解决使用PHP的file_get_contents或curl获取GZIP压缩网页时出现乱码的方法,并提供了示例代码。通过设置合适的选项,可以正确解析并显示GZIP压缩的内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

首先,file_get_contents 应当在php.ini中开启allow_url_fopent


今天在调取一家网站的页面信息时候,使用file_get_contents抑或curl

  1. $url = 'http://cd.xxx.com/';  
  2. $arr = file_get_contents($url);  
  3. echo $arr;  

这时得到了一片乱码,查看了许多内容,包括页面的header信息,发现该站点开启了gzip压缩。这里的解决方案有多种,当然如果你使用file_get_contents的话,可以这样修改,

  1. file_get_contents("compress.zlib://".$url);  

或者使用curl来完成:

  1. function curl_get($url$gzip=false){    
  2.     $curl = curl_init($url);  
  3.     curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);    
  4.     curl_setopt($curl, CURLOPT_CONNECTTIMEOUT, 10);    
  5.     if($gzip) curl_setopt($curl, CURLOPT_ENCODING, "gzip"); // 关键在这里    
  6.     $content = curl_exec($curl);    
  7.     curl_close($curl);    
  8.     return $content;    
  9. }   

同时,参考手册上面的解法,还可以对保存gzip类型的字符串进行处理如下:

  1. function gzdecode($data){    
  2.     $g=tempnam(‘/tmp’,'ff’);    
  3.     @file_put_contents($g,$data);    
  4.     ob_start();    
  5.     readgzfile($g);    
  6.     $d=ob_get_clean();    
  7.     return $d;    
  8. }  

file_get_contents()模拟referer,cookie, 使用proxy等等,如下:
  1. ini_set('default_socket_timeout',120);  
  2. ini_set('user_agent','MSIE 6.0;');  
  3. $context=array('http' => array ('header'=> 'Referer: http://www.baidu.com/', ),);  
  4. $xcontext = stream_context_create($context);  
  5. echo $str=file_get_contents('http://www.webkaka.com/',FALSE,$xcontext);  

模拟post提交

  1. function Post($url,$post = null){  
  2.     $context = array();  
  3.     if(is_array($post)){  
  4.         ksort($post);  
  5.         $context['http'] = array(  
  6.             'timeout' => 60,  
  7.             'method' => 'POST',  
  8.             'context' => http_build_query($post'''&')  
  9.         );  
  10.     }  
  11.     return file_get_contents($url, false, stream_context_create($context));  
  12. }  
  13.   
  14.   
  15. $data = array  
  16. (  
  17.      'name' => 'test',  
  18.      'email' => 'test@gmail.com',  
  19.      'submit' => 'submit',  
  20. );  
  21.   
  22. echo Post($url$data); 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值