Nginx 除了负载均衡，还能做什么？

最新推荐文章于 2024-08-26 22:05:23 发布

转载最新推荐文章于 2024-08-26 22:05:23 发布 · 140 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：https://mp.youkuaiyun.com/editor/html/115455640

nginx 专栏收录该内容

3 篇文章

订阅专栏

本文详细介绍了Nginx在不加载第三方模块时的主要功能，包括反向代理、负载均衡和HTTP服务器。反向代理用于隐藏真实服务器，实现访问转发；负载均衡则通过RR、权重、ip_hash等策略实现服务器间的请求分发，提高服务可用性；HTTP服务器功能则展示了Nginx作为静态资源服务器的能力，以及如何实现动静分离。此外，文章还简单提及了正向代理的概念和作用。

本文只针对 Nginx 在不加载第三方模块的情况能处理哪些事情，由于第三方模块太多所以也介绍不完，当然本文本身也可能介绍的不完整，毕竟只是我个人使用过和了解到过的。

Nginx能做什么

反向代理
负载均衡
HTTP 服务器（包含动静分离）
正向代理

以上就是我了解到的 Nginx 在不依赖第三方模块能处理的事情，下面详细说明每种功能怎么做。

反向代理

反向代理应该是 Nginx 做的最多的一件事了，什么是反向代理呢，以下是百度百科的说法：反向代理（Reverse Proxy）方式是指以代理服务器来接受 internet 上的连接请求，然后将请求转发给内部网络上的服务器，并将从服务器上得到的结果返回给 internet 上请求连接的客户端，此时代理服务器对外就表现为一个反向代理服务器。

简单来说就是真实的服务器不能直接被外部网络访问，所以需要一台代理服务器，而代理服务器能被外部网络访问的同时又跟真实服务器在同一个网络环境，当然也可能是同一台服务器，端口不同而已。下面贴上一段简单的实现反向代理的代码：

server {    
    listen       80;                                                           
    server_name  localhost;                                                 
    client_max_body_size 1024M;  
  
    location / {  
        proxy_pass http://localhost:8080;  
        proxy_set_header Host $host:$server_port;  
    }  
}

保存配置文件后启动 Nginx，这样当我们访问 localhost 的时候，就相当于访问 localhost:8080 了。

负载均衡

负载均衡也是 Nginx 常用的一个功能，负载均衡其意思就是分摊到多个操作单元上进行执行，例如 Web 服务器、FTP 服务器、企业关键应用服务器和其它关键任务服务器等，从而共同完成工作任务。

简单而言就是当有2台或以上服务器时，根据规则随机的将请求分发到指定的服务器上处理，负载均衡配置一般都需要同时配置反向代理，通过反向代理跳转到负载均衡。

Nginx 目前支持自带3种负载均衡策略，还有2种常用的第三方策略。

RR（默认）

每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。

upstream test {  
    server localhost:8080;  
    server localhost:8081;  
}  
server {  
    listen       81;                                                           
    server_name  localhost;                                                 
    client_max_body_size 1024M;  
  
    location / {  
        proxy_pass http://test;  
        proxy_set_header Host $host:$server_port;  
    }  
}

负载均衡的核心代码为：

upstream test {  
    server localhost:8080;  
    server localhost:8081;  
}

这里我配置了2台服务器，当然实际上是一台，只是端口不一样而已，而 8081 的服务器是不存在的，也就是说访问不到，但是我们访问 http://localhost 的时候，也不会有问题，会默认跳转到 http://localhost:8080 具体是因为Nginx会自动判断服务器的状态，如果服务器处于不能访问（服务器挂了），就不会跳转到这台服务器，所以也避免了一台服务器挂了影响使用的情况，由于Nginx默认是RR策略，所以我们不需要其他更多的设置。

权重

指定轮询几率，weight 和访问比率成正比，用于后端服务器性能不均的情况。例如

upstream test {  
    server localhost:8080 weight=9;  
    server localhost:8081 weight=1;  
}

那么10次一般只会有1次会访问到8081，而有9次会访问到8080。

ip_hash

上面的2种方式都有一个问题，那就是下一个请求来的时候请求可能分发到另外一个服务器，当我们的程序不是无状态的时候（采用了 session 保存数据），这时候就有一个很大的很问题了，比如把登录信息保存到了session 中，那么跳转到另外一台服务器的时候就需要重新登录了，所以很多时候我们需要一个客户只访问一个服务器，那么就需要用 iphash 了，iphash 的每个请求按访问 ip 的 hash 结果分配，这样每个访客固定访问一个后端服务器，可以解决 session 的问题。

upstream test {  
    ip_hash;  
    server localhost:8080;  
    server localhost:8081;  
}

fair（第三方）

按后端服务器的响应时间来分配请求，响应时间短的优先分配。

upstream backend {   
    fair;   
    server localhost:8080;  
    server localhost:8081;  
}

url_hash（第三方）

按访问 url 的hash结果来分配请求，使每个 url 定向到同一个后端服务器，后端服务器为缓存时比较有效。在 upstream 中加入 hash 语句，server 语句中不能写入 weight 等其他的参数，hash_method 是使用的 hash 算法

upstream backend {   
    hash $request_uri;   
    hash_method crc32;   
    server localhost:8080;  
    server localhost:8081;  
}

以上5种负载均衡各自适用不同情况下使用，所以可以根据实际情况选择使用哪种策略模式，不过 fair 和 url_hash 需要安装第三方模块才能使用，由于本文主要介绍 Nginx 能做的事情，所以 Nginx 安装第三方模块不会再本文介绍。

HTTP服务器

Nginx 本身也是一个静态资源的服务器，当只有静态资源的时候，就可以使用 Nginx 来做服务器，同时现在也很流行动静分离，就可以通过 Nginx 来实现，首先看看 Nginx 做静态资源服务器。

server {  
    listen       80;                                                           
    server_name  localhost;                                                 
    client_max_body_size 1024M;  
      
    location / {  
        root   e:\wwwroot;  
        index  index.html;  
    }  
}

这样如果访问 http://localhost 就会默认访问到 E 盘 wwwroot目录下面的 index.html，如果一个网站只是静态页面的话，那么就可以通过这种方式来实现部署。

动静分离

动静分离是让动态网站里的动态网页根据一定规则把不变的资源和经常变的资源区分开来，动静资源做好了拆分以后，我们就可以根据静态资源的特点将其做缓存操作，这就是网站静态化处理的核心思路

upstream test{    
   server localhost:8080;    
   server localhost:8081;    
}     
  
server {    
    listen       80;    
    server_name  localhost;    
  
    location / {    
        root   e:\wwwroot;    
        index  index.html;    
    }    
  
    # 所有静态请求都由nginx处理，存放目录为html    
    location ~ \.(gif|jpg|jpeg|png|bmp|swf|css|js)$ {    
        root    e:\wwwroot;    
    }    
  
    # 所有动态请求都转发给tomcat处理    
    location ~ \.(jsp|do)$ {    
        proxy_pass  http://test;    
    }    
  
    error_page   500 502 503 504  /50x.html;    
    location = /50x.html {    
        root   e:\wwwroot;    
    }    
}

这样我们就可以把 HTML 以及图片和 css 以及 js 放到 wwwroot 目录下，而tomcat只负责处理 jsp 和请求，例如当我们后缀为 gif 的时候，Nginx 默认会从 wwwroot 获取到当前请求的动态图文件返回，当然这里的静态文件跟 Nginx 是同一台服务器，我们也可以在另外一台服务器，然后通过反向代理和负载均衡配置过去就好了，只要搞清楚了最基本的流程，很多配置就很简单了，另外 localtion 后面其实是一个正则表达式，所以非常灵活。

正向代理

正向代理，意思是一个位于客户端和原始服务器(origin server)之间的服务器，为了从原始服务器取得内容，客户端向代理发送一个请求并指定目标(原始服务器)，然后代理向原始服务器转交请求并将获得的内容返回给客户端，客户端才能使用正向代理。

resolver 114.114.114.114 8.8.8.8;  
server {  
  
    resolver_timeout 5s;  
  
    listen 81;  
  
    access_log  e:\wwwroot\proxy.access.log;  
    error_log   e:\wwwroot\proxy.error.log;  
  
    location / {  
        proxy_pass http://$host$request_uri;  
    }  
}

resolver 是配置正向代理的 DNS 服务器，listen 是正向代理的端口，配置好了就可以在 IE 上面或者其他代理插件上面使用服务器 ip+端口号进行代理了。

关于代理

说到代理，首先我们要明确一个概念，所谓代理就是一个代表、一个渠道；

此时就涉及到两个角色，一个是被代理角色，一个是目标角色，被代理角色通过这个代理访问目标角色完成一些任务的过程称为代理操作过程；如同生活中的专卖店~客人到adidas专卖店买了一双鞋，这个专卖店就是代理，被代理角色就是adidas厂家，目标角色就是用户。

正向代理

说反向代理之前，我们先看看正向代理，正向代理也是大家最常接触的到的代理模式，我们会从两个方面来说关于正向代理的处理模式，分别从软件方面和生活方面来解释一下什么叫正向代理。

在如今的网络环境下，我们如果由于技术需要要去访问国外的某些网站，此时你会发现位于国外的某网站我们通过浏览器是没有办法访问的，此时大家可能都会用一个代理进行访问，代理的方式主要是找到一个可以访问国外网站的代理服务器，我们将请求发送给代理服务器，代理服务器去访问国外的网站，然后将访问到的数据传递给我们！

上述这样的代理模式称为正向代理，正向代理最大的特点是客户端非常明确要访问的服务器地址；服务器只清楚请求来自哪个代理服务器，而不清楚来自哪个具体的客户端；正向代理模式屏蔽或者隐藏了真实客户端信息。来看个示意图（我把客户端和正向代理框在一块，同属于一个环境，后面我有介绍）：

客户端必须设置正向代理服务器，当然前提是要知道正向代理服务器的IP地址，还有代理程序的端口。如图。

总结来说：正向代理，"它代理的是客户端"，是一个位于客户端和原始服务器(origin server)之间的服务器，为了从原始服务器取得内容，客户端向代理发送一个请求并指定目标(原始服务器)，然后代理向原始服务器转交请求并将获得的内容返回给客户端。客户端必须要进行一些特别的设置才能使用正向代理。

正向代理的用途：
（1）访问原来无法访问的资源，如Google
（2）可以做缓存，加速访问资源
（3）对客户端访问授权，上网进行认证
（4）代理可以记录用户访问记录（上网行为管理），对外隐藏用户信息

反向代理

明白了什么是正向代理，我们继续看关于反向代理的处理方式，举例如我大天朝的某宝网站，每天同时连接到网站的访问人数已经爆表，单个服务器远远不能满足人民日益增长的购买欲望了，此时就出现了一个大家耳熟能详的名词：分布式部署；也就是通过部署多台服务器来解决访问人数限制的问题；某宝网站中大部分功能也是直接使用Nginx进行反向代理实现的，并且通过封装Nginx和其他的组件之后起了个高大上的名字：Tengine，有兴趣的童鞋可以访问Tengine的官网查看具体的信息：http://tengine.taobao.org/。那么反向代理具体是通过什么样的方式实现的分布式的集群操作呢，我们先看一个示意图（我把服务器和反向代理框在一块，同属于一个环境，后面我有介绍）：

通过上述的图解大家就可以看清楚了，多个客户端给服务器发送的请求，Nginx服务器接收到之后，按照一定的规则分发给了后端的业务处理服务器进行处理了。此时~请求的来源也就是客户端是明确的，但是请求具体由哪台服务器处理的并不明确了，Nginx扮演的就是一个反向代理角色。

客户端是无感知代理的存在的，反向代理对外都是透明的，访问者并不知道自己访问的是一个代理。因为客户端不需要任何配置就可以访问。

反向代理，"它代理的是服务端"，主要用于服务器集群分布式部署的情况下，反向代理隐藏了服务器的信息。

反向代理的作用：
（1）保证内网的安全，通常将反向代理作为公网访问地址，Web服务器是内网
（2）负载均衡，通过反向代理服务器来优化网站的负载

项目场景

通常情况下，我们在实际项目操作时，正向代理和反向代理很有可能会存在在一个应用场景中，正向代理代理客户端的请求去访问目标服务器，目标服务器是一个反向代理服务器，反向代理了多台真实的业务处理服务器。具体的拓扑图如下：

二者区别

截了一张图来说明正向代理和反向代理二者之间的区别，如图。

图解：

在正向代理中，Proxy和Client同属于一个LAN（图中方框内），隐藏了客户端信息；

在反向代理中，Proxy和Server同属于一个LAN（图中方框内），隐藏了服务端信息；

实际上，Proxy在两种代理中做的事情都是替服务器代为收发请求和响应，不过从结构上看正好左右互换了一下，所以把后出现的那种代理方式称为反向代理了。

几种常用web服务器对比

对比项	Apache	Nginx	Lighttpd
Proxy代理	非常好	非常好	一般
Rewriter	好	非常好	一般
Fcgi	不好	好	非常好
热部署	不支持	支持	不支持
系统压力	很大	很小	比较小
稳定性	好	非常好	不好
安全性	好	一般	一般
静态文件处理	一般	非常好	好
反向代理	一般	非常好	一般

最后说两句

启动停止及配置文件位置的命令:

/etc/init.d/nginx start/restart # 启动/重启Nginx服务  
  
/etc/init.d/nginx stop # 停止Nginx服务  
  
/etc/nginx/nginx.conf # Nginx配置文件位置

Nginx 是支持热启动的，也就是说当我们修改配置文件后，不用关闭 Nginx，就可以实现让配置生效，Nginx 重新读取配置的命令是 nginx -s reload。