我们用Java开发项目时,发送请求都是用的RestTemplate。最近和其他部门合作时,我们需要请求他们的一个http接口。两边协议都确定好后,发现联调不通。后来发现是我们这边发出的请求,到达对方那边时,他们接收到的是经过了urlencode后的结果,通过wireshark抓包也看到确实发出的请求是被urlencode的。
我们这边的进程,并没有显式调用urlencode相关的方法,因此猜测是RestTemplate自动给我们进行了urlencode。网上查找资料,发现这两篇文章讲得很详细:
https://blog.youkuaiyun.com/Petershusheng/article/details/54236816
RestTemplate确实在底层自动给我们进行了urlencode,不过我们也可以通过UriComponentsBuilder来构建URI对象,手动选择不进行urlencode,具体操作方式可以参考这个文章:
https://blog.youkuaiyun.com/blueheart20/article/details/80916517
riComponentsBuilder builder = UriComponentsBuilder
.fromHttpUrl("http://xxx.com/image-checker/train_mean.txt").queryParam("Expires", "3678172563").queryParam("Signature", "2FqOFfzePCjESlKMqiGc9V8C9Es%3D");
URI uri = builder.build(true).toUri();
不过一般接口调用,都应该进行urlencode,避免一些特殊字符在传递过程中出现问题。因此回到我们这个应用,最终还是联系接口提供方,在接收请求时,对所有参数都进行了urldecode。
RestTemplate中encode请求参数的原理
我的请求参数里面,有个sign参数,其值含有一些特殊符号,比如斜杠(/)和等号(=),经过RestTemplate处理并发送请求后,我抓包发现请求中的斜杠没有被urlencode,但是等号却被urlencode了,这是为什么呢?RestTemplate的urlencode难道不是通用的,而是自定义的么?
下午花了2个小时,通过IDE断点跟踪调试源码,终于弄清楚原因了。
原因
在HierarchicalUriComponents的大约234行,有个encodeUriComponent方法,这个方法就是RestTemplate用来对url中的参数进行encode处理的逻辑:
static String (String source, Charset charset, HierarchicalUriComponents.Type type) {
if (!StringUtils.hasLength(source)) {
return source;
} else {
Assert.notNull(charset, "Charset must not be null");
Assert.notNull(type, "Type must not be null");
byte[] bytes = source.getBytes(charset);
ByteArrayOutputStream bos = new ByteArrayOutputStream(bytes.length);
boolean changed = false;
byte[] var6 = bytes;
int var7 = bytes.length;
for(int var8 = 0; var8 < var7; ++var8) {
byte b = var6[var8];
if (b < 0) {
b = (byte)(b + 256);
}
/*
* 这个type规定了哪些字符需要被encode转义
*/
if (type.isAllowed(b)) {
bos.write(b);
} else {
bos.write(37);
char hex1 = Character.toUpperCase(Character.forDigit(b >> 4 & 15, 16));
char hex2 = Character.toUpperCase(Character.forDigit(b & 15, 16));
bos.write(hex1);
bos.write(hex2);
changed = true;
}
}
return changed ? new String(bos.toByteArray(), charset) : source;
}
}
从代码可以看到,encode的过程,是先将参数转为byte数组,然后逐个byte进行检查,如果发现某个byte不在url参数允许的范围内,则对其进行encode操作。
然后我们找到上面的HierarchicalUriComponents.Type.QUERY_PARAM的代码,大约在HierarchicalUriComponents的811行:
QUERY_PARAM {
public boolean isAllowed(int c) {
// 61是=,31是&
if (61 != c && 38 != c) {
// 47是/,63是?
return this.isPchar(c) || 47 == c || 63 == c;
} else {
return false;
}
}
}
从上面的逻辑可以看到,如果字符是斜杠(ASCII码等于47),那么进程会判断这个字符是在url参数中被允许的,则不进行encode了;而等号(ASCII码为61)被其判断为是一个不被允许的url字符,因此就会被encode。
至此,原因终于找到了。
解决方案
解决方案也比较简单,因为我们可以自行选择要不要让RestTemplate对我们的参数进行urlencode,所以我们可以先自己手动将url进行encode,然后发送请求时,选择不让RestTemplate自动做encode即可。
使用UriComponentBuilder
public UriComponents build()Build a
UriComponentsinstance from the various components contained in this builder.Returns:
the URI components
public UriComponents build(boolean encoded)Variant of
build()to create aUriComponentsinstance when components are already fully encoded. This is useful for example if the builder was created viafromUri(URI).Parameters:
encoded- whether the components in this builder are already encodedReturns:
the URI components
这是处理参数的方法:
/**
* 将Key-Value格式的Map参数,转换为url参数,类似key1=value1&key2=value2这样
* 做了2个特殊的操作:
* 1.对参数名进行了排序
* 2.对value进行urlencode处理
* @param mapper
* @return
*/
public static String mapToUrlString(Map<String, Object> mapper, boolean encode) {
String urlString = "";
TreeMap<String,Object> map =new TreeMap<>();
map.putAll(mapper);
for (Map.Entry<String,Object> entity : map.entrySet()) {
String value = "";
try {
value = encode ? URLEncoder.encode((String)entity.getValue(), "UTF-8") : (String)entity.getValue();
} catch (UnsupportedEncodingException e) {
logger.error("获取参数[" + entity.getKey() + "]失败:" + e.getMessage());
}
urlString += entity.getKey() + "=" + value + "&";
}
return urlString.substring(0, urlString.length() - 1);
}
这是发送请求的代码:
String requestUrl = "http://www.10jqka.com.cn/"
Map<String, Object> params = new HashMap<>(){
{
put("name", "zhangsan");
put("nickname", "可 / 口 / 可 / 乐");
}
};
HttpMethod httpMethod = this.request.getHttpMethod();
RestTemplate client = new RestTemplate();
HttpHeaders headers = new HttpHeaders();
headers.setContentType(MediaType.APPLICATION_JSON_UTF8);
HttpEntity<String> entity = new HttpEntity<>(headers);
// 将Map格式的参数转为字符串,并且做urlencode
String urlParams = mapToUrlString(params, true);
requestUrl += "?" + urlParams;
// 通过UriComponentsBuilder创建URI对象,这样RestTemplate不会自动进行urlencode
UriComponentsBuilder uriComponentsBuilder = UriComponentsBuilder.fromHttpUrl(requestUrl);
URI uri = uriComponentsBuilder.build(true).toUri();
String resultContent = client.exchange(uri, HttpMethod.GET, entity, String.class).getBody();
参考 https://stackoverflow.com/questions/28182836/resttemplate-to-not-escape-url

本文介绍了在Java开发中使用RestTemplate发送HTTP请求时遇到的URL编码问题。当请求参数包含特殊字符如斜杠(/)和等号(=)时,发现RestTemplate对等号进行了自动urlencode,但未对斜杠编码。通过源码分析,了解到RestTemplate内部根据HierarchicalUriComponents.Type.QUERY_PARAM规则决定是否编码。解决方案是利用UriComponentsBuilder手动构建URI并指定编码状态,避免RestTemplate自动编码。
2194

被折叠的 条评论
为什么被折叠?



