正则表达式总结

正则表达式是一种强大的文本模式匹配工具,广泛应用于各种编程语言中,如Scala、PHP、Java等。它通过定义特定的规则来搜索、替换和验证文本。基本的正则表达式符号包括`^`表示开始和`$`表示结束,例如`^[0-9]abc$`将匹配以数字开头,以abc结尾的字符串。在实际应用中,正则表达式常用于数据验证、文本过滤和搜索替换等场景。在线工具如Rubular提供方便的正则表达式测试和匹配功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

正则表达式,又称规则表达式,是一种文本模式,通常用来检索、替换和控制文本。主要包括a 到 z 的字母以及一些特殊的元字符。

正则表达式的应用范围非常之广泛,最初是由Unix普及开来的,后来在广泛运用于Scala 、PHP、C# 、Java、C 、Objective-c、Perl 、Swift、VBScript 、Javascript、Ruby 以及Python等等。

1. 什么是正则表达式
正则表达式是一种特殊的字符串模式,用于匹配一组字符串,就好比用模具做产品,而正则就是这个模具,定义一种规则去匹配符合规则的字符。

2. 为什么要用正则表达式?
常用的搜索、替换、匹配、过滤、文本和数据验证的操作是正则表达式最常见的应用场景,在各行各业中有着广泛的应用。

3. 常用的正则在线匹配工具: https://rubular.com/

4. 正则表达式语法
"^" :^会匹配行或者字符串的起始位置,有时还会匹配整个文档的起始位置。 
"$" :$会匹配行或字符串的结尾
例子:   表达式:^[0-9] abc$
^ 匹配输入字符串的开始位置。
[0-9] 匹配多个数字, [0-9] 匹配单个数字, 匹配一个或者多个。
abc$ 匹配字母 abc 并以 abc 结尾,$ 为匹配输入字符串的结束位置
注意:表达式的结尾处的g (代表全局匹配标记)、 i (代表不区分大小写标记)

图例如下:

正则表达式具体的规则如下: 

 

原子是正则表达式中最基本的组成单位,每个正则表达式中至少包含一个原子。

常见的原子类型有:

普通字符作为原子 如:a b c 字母

非打印字符作为原子 如:\n \t

通用字符作为原子 如:\d \D \w \W \s \S

原子表 如:多个原子拼接在一起

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值