好程序员大数据培训分享MongoDB中regex用法

好程序员IT

于 2020-12-02 16:11:15 发布

阅读量421

点赞数

分类专栏：大数据培训好程序员文章标签：数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_35970166/article/details/110487296

版权

好程序员同时被 2 个专栏收录

949 篇文章

订阅专栏

大数据培训

185 篇文章

订阅专栏

本文详细介绍了MongoDB中regex的使用方法，包括在$in查询、隐式and查询、各种选项如i、m、s和x的运用，以及如何优化查询速度和利用索引。通过实例演示了如何查询以特定字符结尾、忽略大小写、匹配多行等场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

好程序员大数据培训分享MongoDB中regex用法，Part1:写在最前
　　使用MySQL或其他关系型数据库的朋友们都知道，使用模糊查询的用法类似于：
　　SELECT*FROMproductsWHEREskulike"%789";
　　本文中介绍的MongoDB中的regex就是实现类似功能的，regex为能使你在查询中使用正则表达式。本文会用简单的实例带您了解MongoDB中regex的用法~

Part2:用法

使用$regex时，有以下几种用法：

{:{ $r e g e x : / p a t t e r n /,$ options:’’}}

{:{ $r e g e x :^{'} p a t t e r n^{'},$ options:’’}}

{:{$regex:/pattern/}}

option参数的含义：

选项含义使用要求

i大小写不敏感

m

查询匹配中使用了锚，例如^（代表开头）和$（代表结尾），以及匹配\n后的字符串

x

忽视所有空白字符

要求 $r e g e x 与$ option合用

s允许点字符（.）匹配所有的字符，包括换行符。要求 $r e g e x 与$ option合用

实战

Part1:$in中的用法

要在$in查询中包含正则表达式，只能使用JavaScript正则表达式对象（即/pattern/）。例如：

{name:{$in:[/^acme/i,/ack/]}}

Warning:警告 $i n 中不能使用$ regex运算符表达式。

Part2:隐式and用法

要在逗号分隔的查询条件中包含正则表达式，请使用$regex运算符。例如：

{name:{ $r e g e x : / a c m e . * c o r p / i,$ nin:[‘acmeblahcorp’]}}

{name:{ $r e g e x : / a c m e . * c o r p /,$ options:‘i’,$nin:[‘acmeblahcorp’]}}

{name:{ $r e g e x :^{'} a c m e . * c o r p^{'},$ options:‘i’,$nin:[‘acmeblahcorp’]}}

Part3:x和s选项

要使用x选项或s选项，要求 $r e g e x 与$ option合用。例如，要指定i和s选项，必须使用$options来执行以下操作：

{name:{ $r e g e x : / a c m e . * c o r p /,$ options:“si”}}

{name:{ $r e g e x :^{'} a c m e . * c o r p^{'},$ options:“si”}}

Part4:索引的使用

对于区分大小写的正则表达式查询，如果字段存在索引，则MongoDB将正则表达式与索引中的值进行匹配，这比全表扫描更快。如果正则表达式是“前缀表达式”，那么可以优化查询速度，且查询结果都会以相同的字符串开头。

正则表达式也要符合“最左前缀原则”，例如，正则表达式/^abc.*/将通过仅匹配以abc开头的索引值来进行优化。

Warning:警告

1.虽然/^a/，/a.*/和/^{a.*$/匹配等效字符串，但它们的性能是不一样的。如果有对应的索引，所有这些表达式就都使用索引;不过，/^a.*/和/^a.*$/较慢。这是因为/}a/可以在匹配前缀后停止扫描。

2.不区分大小写的正则表达式查询通常不能使用索引，$regex无法使用不区分大小写的索引。

Part5:实例

一个商品的集合中，存了以下内容

{"_id":100,“sku”:“abc123”,“description”:“Singlelinedescription.”}

{"_id":101,“sku”:“abc789”,“description”:“Firstline\nSecondline”}

{"_id":102,“sku”:“xyz456”,“description”:“Manyspacesbeforeline”}

{"_id":103,“sku”:“xyz789”,“description”:“Multiple\nlinedescription”}

如果想对该商品products集合执行一个查询，范围是sku列中的内容是789结尾的：

db.products.find({sku:{ $r e g e x : / 789$ /}})

结合MySQL理解的话，上述查询在MySQL中是这样的SQL:

SELECT*FROMproductsWHEREskulike"%789";

如果想查询sku是abc、ABC开头的，且匹配时忽略大小写，可以使用i选项：

db.products.find({sku:{$regex:/^ABC/i}})、

查询结果为：

{"_id":100,“sku”:“abc123”,“description”:“Singlelinedescription.”}

{"_id":101,“sku”:“abc789”,“description”:“Firstline\nSecondline”}

Part6:m的使用

想查询描述中是包含S开头的，且要匹配/n后的S开头的，则需要加m选项

db.products.find({description:{ $regex:/^S/,$ options:‘m’}})

返回的结果是：

{"_id":100,“sku”:“abc123”,“description”:“Singlelinedescription.”}

{"_id":101,“sku”:“abc789”,“description”:“Firstline\nSecondline”}

如果不加m选项的话，返回的结果是这样的：

{"_id":100,“sku”:“abc123”,“description”:“Singlelinedescription.”}

如果不使用^这类锚的话，那么会返回全部结果：

db.products.find({description:{$regex:/S/}})

{"_id":100,“sku”:“abc123”,“description”:“Singlelinedescription.”}

{"_id":101,“sku”:“abc789”,“description”:“Firstline\nSecondline”}

Part7:s的使用

使用s选项来执行查询，则会让逗号.匹配所有字符，包括换行符，下文查询了description列中m开头，且后面包含line字符串的结果：

db.products.find({description:{ $r e g e x : / m . * l i n e /,$ options:‘si’}})

{"_id":102,“sku”:“xyz456”,“description”:“Manyspacesbeforeline”}

{"_id":103,“sku”:“xyz789”,“description”:“Multiple\nlinedescription”}

如果不包含s，则会返回：

{"_id":102,“sku”:“xyz456”,“description”:“Manyspacesbeforeline”}

Part8:x的使用

以下示例使用x选项忽略空格和注释，用＃表示注释，并以匹配模式中的\n结尾：

varpattern=“abc#categorycode\n123#itemnumber”

db.products.find({sku:{ $r e g e x : p a t t e r n,$ options:“x”}})

查询的结果是：

{"_id":100,“sku”:“abc123”,“description”:“Singlelinedescription.”}

可以看出，其忽略了abc与#category的空格以及#category与code的空格，实际执行的查询是sku是abc123的结果。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。