网络负载均衡的大致原理是利用一定的分配策略将网络负载平衡地分摊到网络集群的各个操作单元上,使得单个重负载任务能够分担到多个单元上并行处理,使得大量并发访问或数据流量分担到多个单元上分别处理,从而减少用户的等待响应时间。
Nginx 先使用负载均衡模块找到一台主机,再使用 upstream 模块实现与这台主机的交互。
1.负载均衡的方式
-
轮询(默认):每个请求按时间顺序逐一分配到不同的后端服务器,如果后端服务器down掉,能自动剔除
-
weight:指定轮询几率,weight和访问比率成正比,用于后端服务器性能不均的情况
-
ip_hash:每个请求按访问ip的hash结果分配,这样每个访客固定访问一个后端服务器
-
backup:其它所有的非backup机器down掉或者忙的时候,请求backup机器。所以这台机器压力会最轻
-
down:表示当前的server暂时不参与负载
-
fair:按后端服务器的响应时间来分配请求,响应时间短的优先分配
2.配置示例
upstream myserver {
# 核心指令ip_hash只能在 upstream {}中使用。这条指令用于通知 Nginx 使用 ip hash 负载均衡算法
ip_hash;
# 在以下2台服务器之间进行负载均衡
server 192.168.11.161:8080 max_fails=2 fail_timeout=60s;
server 192.168.11.159:8080;
}
server {
listen 80;
server_name localhost;
location / {
proxy_pass http://myserver;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_next_upstream error timeout http_500 http_503;
proxy_connect_timeout 60s;
proxy_send_timeout 60s;
proxy_read_timeout 60s;
}
}
proxy_next_upstream
语法:proxy_next_upstream [error | timeout | invalid_header | http_500 | http_502 | http_503 | http_504 | http_404 | off ];
默认:proxy_next_upstream error timeout;
配置块:http、server、location 这个配置表示当向一台上有服务器转发请求出现错误的时候,继续换一台上后服务器来处理这个请求。
默认情况下,上游服务器一旦开始发送响应数据,Nginx反向代理服务器会立刻把应答包转发给客户端。因此,一旦Nginx开始向客户端发送响应包,如果中途出现错误也不允许切换到下一个上有服务器继续处理的。这样做的目的是保证客户端只收到来自同一个上游服务器的应答。
proxy_connect_timeout
语法: proxy_connect_timeout time;
默认: proxy_connect_timeout 60s;
范围: http, server, location
用于设置nginx与upstream server的连接超时时间,比如我们直接在location中设置proxy_connect_timeout 1ms, 1ms很短,如果无法在指定时间建立连接,就会报错。
proxy_send_timeout
向后端写数据的超时时间,两次写操作的时间间隔如果大于这个值,也就是过了指定时间后端还没有收到数据,连接会被关闭
proxy_read_timeout
从后端读取数据的超时时间,两次读取操作的时间间隔如果大于这个值,那么nginx和后端的链接会被关闭,如果一个请求的处理时间比较长,可以把这个值设置得大一些
proxy_upstream_fail_timeout
设置了某一个upstream后端失败了指定次数(max_fails)后,在fail_timeout时间内不再去请求它,默认为10秒
# 在失败了2次之后,在60秒内不再去请求该服务器 server 192.168.11.161:8080 max_fails=2 fail_timeout=60s