httpClient java.net.URLEncoder.encode二次转码问题

在使用HttpClient发送GET请求时,如果URL包含汉字,可能会遇到二次转码的问题。Java的`java.net.URLEncoder.encode()`在前端进行编码后,HttpClient在内部又进行了一次编码。解决办法是在构造HTTP请求时,正确处理已编码的查询字符串,避免重复编码。本文通过示例代码展示了这个问题及解决方案。
部署运行你感兴趣的模型镜像

httpClient  java.net.URLEncoder.encode二次转码问题

我在servlet中调用java.net.URLDecoder.decode(request.getParameter("name"), "UTF-8")方法和调用java.net.URLDecoder.decode(request.getQueryString(), "UTF-8")所得到的结果是不一样的,就是由于在request.getParameter("name")之前会自动做一次解码的工作,而且是默认的ISO-8859-1。

所以,在使用java.net.URLEncoder.decode()和java.net.URLDecoder.decode(),的时候需要在前端页面中使用两次java.net.URLDecoder.decode()方法。

使用两次编码的过程相当于如下代码:
            String name=java.net.URLEncoder.encode("测试", "UTF-8");
            System.out.println(name);
            name=java.net.URLEncoder.encode(name,"UTF-8");
            System.out.println(name);
            name=java.net.URLDecoder.decode(name, "UTF-8");
            System.out.println(name);
            System.out.println(java.net.URLDecoder.decode(name, "UTF-8"));

输出为:

            %E6%B5%8B%E8%AF%95
            %25E6%25B5%258B%25E8%25AF%2595
            %E6%B5%8B%E8%AF%95
            测试

第一次编码后将汉字编码为%和字母数字的格式,而第二次编码的时候是对%字母数字进行编码,虽然解码的时候使用的是ISO-8859-1,但是对于%和字母数字而言用ISO-8859-1和UTF-8解码出来的是一样的,此时就回到了汉字被编码过一次的字符串了,当再次进行解码的时候使用UTF-8就回将它转会汉字;


具体实现:

new Thread(new Runnable() {
                                @Override
                                public void run() {

                                  httpClient会二次把%转码
                                    /*HttpMethod httpMethod = new GetMethod();
                                    String httpurl = Key.LOGGER_URL + "?category=server&permanent=" + cookies + "&user_hash=" + tempUid
                                            + "&product=wap" + "&version=1.2&view=register&action=" + promptEn + "&channel=" + sid
                                            + "&source=&referer=" + referer1
                                            + "&user_agent=" + java.net.URLEncoder.encode(request1.getHeader("user-agent"))
                                            + "&created=" + System.currentTimeMillis()
                                            + "&client_ip=&url=" + url1;
                                    try {
                                        HttpClient httpClient = new HttpClient();
                                        httpClient.getHttpConnectionManager().getParams().setConnectionTimeout(60000);
                                        httpMethod.getParams().setParameter(HttpMethodParams.SO_TIMEOUT, 30000);
                                        httpMethod.getParams().setParameter(HttpMethodParams.HTTP_CONTENT_CHARSET, "utf-8");
                                        httpMethod.getParams().setParameter("user-agent", "wap.zch168.com");
//                                        System.out.println("httpurl:::" + httpurl);
                                        httpMethod.setURI(new URI(httpurl, false, "utf-8"));
                                        httpClient.executeMethod(httpMethod);
                                    } catch (Exception e) {
                                        e.printStackTrace();
                                    }
                                    httpMethod.releaseConnection();*/

                                   //后改用:
                                    SafelotteryHttp http = new SafelotteryHttp();
                                    try{
                                        String httpurl = Key.LOGGER_URL + "?category=server&permanent=" + cookies + "&user_hash=" + tempUid
                                                + "&product=wap" + "&version=1.2&view=register&action=" + promptEn + "&channel=" + sid
                                                + "&source=&referer=" + referer1
                                                + "&user_agent=" + user_agent
                                                + "&created=" + System.currentTimeMillis()
                                                + "&client_ip=&url=" + url1;
                                        http.doGet(httpurl, null, "UTF-8", true);
                                    }catch(Exception e){
                                        e.printStackTrace();
                                    }
                                }
                            }).start();




public static String doGet(String url, String queryString, String charset, boolean pretty) {
        StringBuffer response = new StringBuffer();
        HttpClient client = new HttpClient();
        HttpMethod method = new GetMethod(url);
        try {
            if (StringUtils.isNotBlank(queryString))
                //对get请求参数做了http请求默认编码,好像没有任何问题,汉字编码后,就成为%式样的字符串
                method.setQueryString(URIUtil.encodeQuery(queryString));
            client.executeMethod(method);
            if (method.getStatusCode() == HttpStatus.SC_OK) {
                BufferedReader reader = new BufferedReader(new InputStreamReader(method.getResponseBodyAsStream(), charset));
                String line;
                while ((line = reader.readLine()) != null) {
                    if (pretty)
                        response.append(line).append(System.getProperty("line.separator"));
                    else
                        response.append(line);
                }
                reader.close();
            }
        } catch (URIException e) {
            logger.error("执行HTTP Get请求时,编码查询字符串“" + queryString + "”发生异常!", e);
        } catch (IOException e) {
            logger.error("执行HTTP Get请求" + url + "时,发生异常!", e);
        } finally {
            method.releaseConnection();
        }
        return response.toString();
    }


您可能感兴趣的与本文相关的镜像

Seed-Coder-8B-Base

Seed-Coder-8B-Base

文本生成
Seed-Coder

Seed-Coder是一个功能强大、透明、参数高效的 8B 级开源代码模型系列,包括基础变体、指导变体和推理变体,由字节团队开源

在处理URL编码问题时,关键在于理解不同编程语言和框架如何处理特殊字符,并确保在请求发送端和接收端使用一致的编码方式。以下是常见的URL编码问题及解决方法: ### URL编码常见问题 1. **未对特殊字符进行编码** URL中包含如空格、`#`、`&`、`=`、`?`等特殊字符时,若未正确编码,会导致参数解析错误。例如,`&`在URL中用于分隔参数,若作为值传递而未编码,将导致参数截断或解析错误。解决方法是使用语言内置的编码函数,如Python中的`urllib.parse.quote`,JavaScript中的`encodeURIComponent`,Java中的`URLEncoder.encode`等。 2. **重复编码** 有时开发人员在发送请求前已经对参数进行了URL编码,但HTTP库(如`axios`、`fetch`、`HttpClient`)又自动对URL进行了编码,导致参数被重复编码。例如,`%2F`再次编码会变成`%252F`,服务器无法正确解析。解决方法是在发送请求前确保参数未被提前编码,或使用库提供的选项跳过自动编码。 3. **编码方式不一致** 不同语言或框架在处理URL编码时可能使用不同的字符集(如UTF-8、GBK等),若前后端编码方式不一致,可能导致乱码。建议统一使用UTF-8编码,并在后端设置正确的字符集解码方式。例如,在Spring Boot中可通过`CharacterEncodingFilter`设置请求编码为UTF-8。 4. **路径与查询参数混淆** URL路径部分(path)与查询参数部分(query)的编码规则略有不同。路径部分应使用`encodeURLComponent`或`quote`进行编码,而查询参数通常由HTTP客户端自动处理。例如,在使用`axios`时,可通过`params`选项自动编码查询参数,而路径部分需手动编码[^2]。 ### 示例代码 #### Python中使用`urllib.parse.quote`进行编码 ```python import urllib.parse path = "/src/lcm/[acd].txt" encoded_path = urllib.parse.quote(path) print(encoded_path) # 输出: /src/lcm/%5Bacd%5D.txt ``` #### JavaScript中使用`encodeURIComponent` ```javascript const path = '/src/lcm/[acd].txt'; const encodedPath = encodeURIComponent(path); console.log(encodedPath); // 输出: %2Fsrc%2Flcm%2F%5Bacd%5D.txt ``` #### Java中使用`URLEncoder` ```java import java.net.URLEncoder; import java.nio.charset.StandardCharsets; public class Main { public static void main(String[] args) { String path = "/src/lcm/[acd].txt"; String encodedPath = URLEncoder.encode(path, StandardCharsets.UTF_8); System.out.println(encodedPath); // 输出: %2Fsrc%2Flcm%2F%5Bacd%5D.txt } } ``` ### 注意事项 - **路径编码与查询参数编码的区别**:路径部分应保留`/`等字符的原始含义,因此应使用`encodeURLComponent`进行编码;而查询参数可由HTTP客户端自动处理。 - **避免重复编码**:在使用如`axios.get(url, { params })`时,`params`对象会自动进行URL编码,因此无需手动对参数进行`encodeURIComponent`处理[^2]。 - **统一字符集**:前后端应统一使用UTF-8编码,以避免因字符集不同导致的解码错误。 ### 常见编码字符对照表 | 原始字符 | 编码后形式 | |----------|-------------| | 空格 | `%20` | | `#` | `%23` | | `&` | `%26` | | `=` | `%3D` | | `?` | `%3F` | | `[` | `%5B` | | `]` | `%5D` | ### 总结 URL编码错误通常源于未正确处理特殊字符、重复编码或编码方式不一致。通过使用语言内置的编码工具函数、合理使用HTTP客户端的自动编码功能,并确保前后端统一字符集,可以有效避免URL编码问题
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值