项目中遇到的URL汉字参数转码的问题

本文讨论了在项目中使用Ajax通过URL传递中文参数时出现的问题,包括参数在IE环境下被转为%u格式的情况,并提供了在PHP中正确处理这些参数的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在项目中遇到这样一个问题,url中用中文传递参数,用户是用ajax提交数据的。


以下是用JS获取url的参数,以及相关信息

function GetRequest() 
{
   var url = location.search;
   var theRequest = new Object();
   if (url.indexOf("?") != -1) 
   {
	  var str = url.substr(1);
	  strs = str.split("&");
	  for(var i = 0; i < strs.length; i ++) 
          {
		 theRequest[strs[i].split("=")[0]]=unescape(strs[i].split("=")[1]);
	  }
   }
   return theRequest;
}

var utm_term = typeof(Request['utm_term']) == 'undefined' ? '' : '&utm_term='+escape(Request['utm_term']);

if (utm_term != '')
{
	var url = document.referrer;
	var tempurl = '';
	var theRequest = new Object();
	if (url.indexOf("?") != -1) 
	{
		var str = url.substr(1);
		strs = str.split("&");
		for (var i = 0; i < strs.length; i++) 
		{
			theRequest[strs[i].split("=")[0]] = unescape(strs[i].split("=")[1]);
		}

		if (typeof(theRequest['word']) != 'undefined')
		{
			tempurl = theRequest['word'].split('/')[2];
		}
		else if (typeof(theRequest['ltu']) != 'undefined')
		{
			tempurl = theRequest['ltu'].split('/')[2];
		}
		else if (typeof(theRequest['u']) != 'undefined')
		{
			tempurl = theRequest['u'].split('/')[2];
		}
		else
		{
			tempurl = url.split('/')[2];
		}
	}
	else 
	{
		tempurl = url.split('/')[2];
	}
	utm_term = utm_term + '[' + tempurl + ']';
}

提交信息

$.ajax({
	type: 'post',
	data: utm_term,
	dataType: 'json',
	error: function () {
	
	},
	success: function (data) {

	},
	url: '/regist'
});

在IE下参数 被转为 %u6708

接受到参数后,在php中做了处理,方法如下:


	$str = '%u6708';
	
	$arr = explode('%u', $str);
	$len = count($arr);
	
	for ($i=1;$i<$len;$i++)
	{
		if (strlen ($arr[$i]) >= 4)
		{
			$temp_str = substr ($arr[$i], 0, 4);
			
			$search_str = '%u'.substr ($arr[$i], 0, 4);
			
			$replace_str = '&#'.hexdec ($temp_str).';';
			
			$replace_str = mb_convert_encoding ($replace_str, 'UTF-8', 'HTML-ENTITIES');
			
			$str = str_replace ($str, $replace_str, $return_str);
		}
		
	}
	
	return $str;



### Python GET 请求 URL 中文参数 编码方法 当处理包含中文字符的URL时,`urllib.parse.quote` 是一种有效的方法来对单个字符串进行编码。对于更复杂的查询参数字典,则可以使用 `urlencode` 方法。 #### 使用 `urllib.parse.quote` 为了正确地对含有中文字符的URL组件进行编码,推荐使用 `urllib.parse.quote` 函数。该函数能够将非ASCII字符转换成百分号编码形式[^1]: ```python from urllib.parse import quote chinese_string = "你好" encoded_string = quote(chinese_string) print(encoded_string) # %E4%BD%A0%E5%A5%BD ``` 这种方法适用于需要手动构建URL的情况,特别是当你只需要对特定的部分而不是整个查询串进行编码的时候。 #### 使用 `urllib.parse.urlencode` 然而,在实际应用中,通常会有一个包含多个键值对作为查询参数的字典。此时应该采用 `urllib.parse.urlencode` 来一次性完成所有参数的编码工作[^2]: ```python from urllib.parse import urlencode import requests query_params = { 'wd': '赵丽颖' } encoded_query = urlencode(query_params) base_url = 'https://www.baidu.com/s?' full_url = base_url + encoded_query response = requests.get(full_url) with open('baidu_zhaoliying_search.html', 'w', encoding='utf-8') as file: file.write(response.text) ``` 这段代码展示了如何通过给定的基础URL和查询参数构造完整的HTTP GET请求链接,并将其结果保存至本地文件。注意这里也包含了文件操作部分用于示范目的。 #### 处理复杂情况下的URL解析与重构 有时可能遇到更加复杂的URL结构,这时就需要用到其他工具如 `urlsplit()` 或者 `urlunsplit()` 来帮助分析并重新组合URL各组成部分[^3]。不过这些功能超出了当前讨论范围关于简单GET请求的需求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值