负载均衡问题
在分布式环境中,我们倾向于比较均衡的利用每台机器,不至于单点过载,也能发挥集群的最大价值。
比较常见的方法是轮询与随机分配,一般按照实例多少加以权值,所以一般采用的是加权轮询以及加权随机。
但是大多数策略问题在于:无法应对带有多种状态的请求或者服务
例子——为什么有状态服务负载均衡比较复杂
有状态的请求:
我们再分布式KV缓存系统中,往往会把数据水平切分到不同节点来存储,为了保证系统可用性,冗余是必要的,对于这样的系统,某个key值应该在某一个确定的节点上获取,而不是随便访问一个节点都能得到全局的key 这样的服务我们认为是有状态的。
再比如,dag中某一个节点的操作,需要受到之前请求节点的影响,这样的请求也是有状态的。
我们登录qq时,服务会取服务器拉取消息,以便进行消息的推送。这种请求是有状态的。
由于需要推送的消息很多,服务器以流形式推送,所以需要时刻记录推送消息的位置。
- 当连接失败,客户端重连时,一定要保证客户端重连到之前连接的服务器,因为只有这台服务器记录了该客户端之前消息的位置,以便从该位置继续推送
如果负载均衡采用的是随机或者轮询策略,客户端下次请求的时候,大概率就不会再打到上一次请求的节点了,所以,面对许多有状态的服务和请求,这是有很大问题的。那我们如何解决这种情况下的负载均衡呢?