PHP - urlencode和rawurlencode的区别

本文详细解析了PHP中的urlencode和rawurlencode函数在处理字母数字、特殊符号、中文等字符时的区别,特别关注了对空格的处理差异。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

请将下面的代码保存到一个PHP文件中:

[php]   view plain copy
  1. <?php  
  2. test_encode('http://www.baidu.com?a=search&k=eclipse');  
  3. test_encode(':/?= &#');  
  4. test_encode('中文');  
  5. function test_encode($s)  
  6. {  
  7.   echo "<b>urlencode('$s')</b> = [<b>";  
  8.   var_dump(urlencode($s));    
  9.   echo "</b>]<br/>";  
  10.   echo "<b>rawurlencode('$s')</b> = [<b>";  
  11.   var_dump(rawurlencode($s));    
  12.   echo "</b>]<br/>";  
  13. }  

上面代码执行结果如下:

[php]   view plain copy
  1. urlencode('http://www.baidu.com?a=search&k=eclipse') = [string(53) "http%3A%2F%2Fwww.baidu.com%3Fa%3Dsearch%26k%3Declipse" ]  
  2. rawurlencode('http://www.baidu.com?a=search&k=eclipse') = [string(53) "http%3A%2F%2Fwww.baidu.com%3Fa%3Dsearch%26k%3Declipse" ]  
  3. urlencode(':/?= &#') = [string(19) "%3A%2F%3F%3D+%26%23" ]  
  4. rawurlencode(':/?= &#') = [string(21) "%3A%2F%3F%3D%20%26%23" ]  
  5. urlencode('中文') = [string(18) "%E4%B8%AD%E6%96%87" ]  
  6. rawurlencode('中文') = [string(18) "%E4%B8%AD%E6%96%87" ]  

 

从上面的执行结果可以看出,urlencode和rawurlencode两个方法在处理字母数字,特殊符号,中文的时候结果都是一样的,唯一的不同是对空格的处理,urlencode处理成“+”,rawurlencode处理成“%20”。

 

 


 

看看PHP Manual对两个函数的说明:

urlencode:返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数,空格则编码为加号(+)。此编码与 WWW 表单 POST 数据的编码方式是一样的,同时与 application/x-www-form-urlencoded 的媒体类型编码方式一样。由于历史原因,此编码在将空格编码为加号(+)方面与 RFC1738 编码(参见 rawurlencode())不同。

rawurlencode:返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数。这是在 RFC 1738 中描述的编码,是为了保护原义字符以免其被解释为特殊的 URL 定界符,同时保护 URL 格式以免其被传输媒体(像一些邮件系统)使用字符转换时弄乱。

### PHP `urlencode` 编码后加号被替换为空格的解决方案 当使用 PHP 的 `urlencode()` 函数对字符串进行编码时,空格会被转换成加号 (`+`)。然而,在某些情况下,这些加号可能会在解码过程中被错误地解析为空格。为了防止这种情况发生并确保加号能够正确传递,可以采取以下几种方法: #### 方法一:使用 `rawurlencode()` 相比于 `urlencode()`,函数 `rawurlencode()` 将会把所有的非安全字符都转化为 `%XX` 形式的编码形式,其中也包括加号(`+`)。因此,如果希望保留加号而不让它变为其他符号,则应该考虑改用这个替代品。 ```php $originalString = "Hello World!"; $safeString = rawurlencode($originalString); echo $safeString; ``` 这样做的好处在于,无论是在发送端还是接收端,只要双方一致采用相同的编码标准就不会出现问题[^5]。 #### 方法二:手动替换已编码后的字符串中的加号为 %20 另一种方式就是在调用了 `urlencode()` 后再做一次简单的字符串替换操作,即把所有出现过的加号重新设置回它的 URL 百分比编码表示法——也就是 `%20`: ```php $encodedUrl = urlencode("hello world+"); $fixedEncoded = str_replace('+', '%20', $encodedUrl); echo htmlspecialchars($fixedEncoded); // 输出 hello%20world%2B ``` 这种方法适用于那些已经依赖于 `urlencode()` 并且不想更改现有代码的情况下的临时修复措施[^1]。 #### 方法三:自定义编码函数 对于更复杂的需求或者想要完全控制整个过程的情形来说,编写一个自己的编码器可能是最好的选择之一。下面给出了一种可能实现的例子: ```javascript function customUrlEncode(str) { return encodeURIComponent(str).replace(/[!'()*]/g, function(c){ return '%' + c.charCodeAt(0).toString(16).toUpperCase(); }); } console.log(customUrlEncode('hello world!')); // 输出 hello%20world%21 ``` 请注意这里实际上是一个 JavaScript 版本的示例;不过同样的逻辑也可以很容易地移植到 PHP 当中去实现类似的定制化功能[^3]。 通过上述三种不同的策略,可以根据具体的应用场景个人偏好挑选最合适的方式来应对由 `urlencode()` 导致的加号丢失问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值