问题描述
在运维Hbase集群的时候,经常遇到RS进程宕掉的情况,连接zk客户端的超时时间sessionTimeout设置为180秒,查看FGC时间只有40s,为什么进程会被Kill?
其实只这么设置根本没有任何作用,因为客户端将sessionTimeout的值传给zk时,zk还会根据minSessionTimeout与maxSessionTimeout两个参数重新调整最后的超时值
Java代码
- public int getMinSessionTimeout() {
- return minSessionTimeout == -1 ? tickTime * 2 : minSessionTimeout;
- }
- public int getMaxSessionTimeout() {
- return maxSessionTimeout == -1 ? tickTime * 20 : maxSessionTimeout;
- }
就是说这两个值,默认分别为tickTime 的2倍和20倍,而tickTime的默认值是3秒,即最后生效的超时时间,一定是6s<timeout<60s,原因如下:
Java代码
- int minSessionTimeout = zk.getMinSessionTimeout();
- if (sessionTimeout < minSessionTimeout) {
- sessionTimeout = minSessionTimeout;
- }
- int maxSessionTimeout = zk.getMaxSessionTimeout();
- if (sessionTimeout > maxSessionTimeout) {
- sessionTimeout = maxSessionTimeout;
- }
就是这么简单,至于之前说40s超时,是因为把tickTime设置成2s了,如果想设置为180s超时,将tickTime设置成9s(9000)即可。