常见的nginx正则表达式
^ | 匹配输入字符串的起始位置(已什么开头)。 |
---|---|
$ | 匹配输入字符串的结束位置(已什么结尾)。 |
* | 匹配前面的字符零次或多次。如"01*"能够匹配到"0"、"01"、"011"、"0111......."。 |
+ | 匹配前面的字符一次或多次。如"01*"能够匹配到"01"、"011"、"0111......."。 |
? | 匹配前面字符零次或一次。如01?只能能够匹配到"0"、"01"。 |
. | 匹配除”\n“之外的任意一个字符,若要匹配包括”\n“在内的任意字符则使用”[.\n]“之类的表达式 |
\ | 转义符 |
\d | 匹配出数字效果于[0-9]一致 |
\s | 空白符 |
\w | 任意单词字符包括下划线 |
匹配前面表字符n次 | |
匹配前面字符不少于n次 | |
匹配前面字符n到m次 | |
[] | 定义匹配的字符范围 |
[c] | 匹配单个字符c |
[a-z] | 匹配a-z小写字母任意一个 |
[a-zA-Z0-9] | 匹配范围大小写字母及数字 |
() | 看成整体匹配 |
| | 或运算符 |
location
lication的分类
精准匹配 | location = / |
---|---|
一般匹配 | location / |
正则匹配 | location ~ / |
location 常用的匹配规则
= | 进行普通字符精确匹配,也就是完全匹配 |
---|---|
^~ | 表示普通字符匹配。使用前缀匹配。如果匹配成功,则不再匹配其它 location。 |
~ | 区分大小写的匹配。 |
~* | 不区分大小写的匹配。 |
!~ | 区分大小写的匹配取非。 |
!~* | 不区分大小写的匹配取非。 |
location 匹配的优先级
- 首先精准匹配=
- 其次前缀匹配^~
- 其次是按文件中顺序的正则匹配 或*
- 然后匹配不带任何修饰的前缀匹配
- 最后是交给 / 通用匹配
通用匹配
location / {}
- 因为所有的地址都以 / 开头,所以这条规则将匹配到所有请求 比如访问 / 和 /data, 则 / 匹配, /data 也匹配,
location /test/ {}
- 匹配任何以 /documents/ 开头的地址,匹配符合以后,还要继续往下搜索其它 location
只有其它 location后面的正则表达式没有匹配到时,才会采用这一条
location /test/abc {}
- 匹配任何以 /documents/abc 开头的地址,匹配符合以后,还要继续往下搜索其它 location
只有其它 location后面的正则表达式没有匹配到时,才会采用这一条
正则匹配
location ^~ /images/ {}
- 匹配任何以 /images/ 开头的地址,匹配符合以后,停止往下搜索正则,采用这一条
location ~ .(gif|jpg|jpeg)$ {}*
- 匹配所有以 gif、jpg或jpeg 结尾的请求
然而,所有请求 /images/ 下的图片会被上一条规则 location ^~ /images/ 处理,因为 ^~ 的优先级更高,所以到达不了这一条正则
优先级总结:
(location = 完整路径) > (location ^~ 路径) > (location ,* 正则顺序) > (location 部分起始路径) > (location /)
lcation 匹配
- 首先看 优先级:精确= > 前缀^~ > 正则,* > 一般 > 通用/
- 优先级相同:正则看上下顺序,上面的优先;一般匹配看长度,最长匹配的优先
- 精确、前缀、正则、一般 都没有匹配到,最后再看通用匹配
实际网站使用中,至少有三个匹配规则定义
第一个必选规则
- 直接匹配网站根,通过域名访问网站首页比较频繁,使用这个会加速处理,比如说官网。
- 可以是一个静态首页,也可以直接转发给后端应用服务器
location = /index.html {
root html;
index index.html index.htm;
}
第二个必选规则
- 处理静态文件请求,这是nginx作为http服务器的强项
- 有两种配置模式,目录匹配或后缀匹配,任选其一或搭配使用
location ^~ /static/ {
root /webroot/static/;
}
location ~* \.(gif|jpg|jpeg|png|css|js|ico)$ {
root /webroot/res/;
}
第三个规则
- 是通用规则,比如用来转发带.php、.jsp后缀的动态请求到后端应用服务器
非静态文件请求就默认是动态请求
location / {
proxy_pass http://tomcat_server;
}
rewrite
- rewrite功能就是,使用nginx提供的全局变量或自己设置的变量,结合正则表达式和标记位实现URL重写以及重定向。
- 比如:更换域名后需要保持旧的域名能跳转到新的域名上、某网页发生改变需要跳转到新的页面、网站防盗链等等需求。
- rewrite只能放在server{},location{},if{}中,并且默认只能对域名后边的除去传递的参数外的字符串起作用,
rewrite跳转场景
Rewrite 跳转场景主要包括以下几种
-
可以调整用户浏览的 URL,看起来更规范,合乎开发及产品人员的需求
-
为了让搜索引擎搜录网站内容及用户体验更好,企业会将动态 URL 地址伪装成静态地址提供服务
-
网址换新域名后,让旧的访问跳转到新的域名上。例如,访问京东的 360buy.com会跳转到 jd.com
-
根据特殊变量、目录、客户端的信息进行 URL 调整等。
Rewrite 跳转实现
-
Nginx 是通过 ngx_http_rewrite_module 模块支持 url 重写、支持 if 条件判断,但不支 持 else。
-
另外该模块需要 PCRE 支持,应在编译 Nginx 时指定 PCRE 支持,默认已经安装。
-
根据相关变量重定向和选择不同的配置,从一个 location 跳转到另一个 location,不过这样 的循环最多可以执行 10 次,超过后 Nginx 将返回 500 错误。
-
同时,重写模块包含 set 指令,来创建新的变量并设其值,这在有些情景下非常有用的,如记录条件标识、传递参数到其他location、记录做了什么等等。
rewrite 执行顺序
- 执行 server 块里面的 rewrite 指令。
- 执行 location 匹配。
- 执行选定的 location 中的 rewrite 指令。
语法格式
rewrite <regex> <replacement> [flag];
regex :表示正则匹配规则。
replacement :表示跳转后的内容。
flag :表示 rewrite 支持的 flag 标记。
flag标记说明
- last :本条规则匹配完成后,不终止重写后的url匹配,一般用在 server 和 if 中。
- break :本条规则匹配完成即终止,终止重写后的url匹配,一般使用在 location 中。
- redirect :返回302临时重定向,浏览器地址会显示跳转后的URL地址。
- permanent :返回301永久重定向,浏览器地址栏会显示跳转后的URL地址。