你的字符串需要“智能搜索外挂”
当你需要在文本中找所有手机号时,还在用循环+逐个字符判断吗?
当你要提取日志中的IP地址时,还在手动计算点号位置吗?
正则表达式——这个藏在<regex>
库中的神器,配合C++字符串使用,能让你的字符串处理能力瞬间飙升!今天我们就来解锁这个隐藏技能,保准让你的代码效率翻倍!(文末附实战代码模板,即拿即用!)
第一章:正则表达式是什么?
1. 通俗版解释
想象你有一个智能筛子:
- 筛孔形状可以自由设计(比如只允许数字、字母组合)
- 能自动过滤出符合形状的内容(比如所有以138开头的手机号)
这就是正则表达式!用特定符号描述字符串规则的超级工具。
2. 举个栗子🌰
需求:找出文本中所有形如xxx@xxx.xxx
的邮箱
传统写法:写循环检查@位置、点号位置、字符类型…
正则写法:[a-zA-Z0-9]+@[a-zA-Z0-9]+\.[a-zA-Z]+
直接甩出这个表达式,自动匹配所有符合规则的邮箱!
第二章:正则表达式语法速成(附记忆口诀)
1. 基础元字符(必须掌握的四大天王)
符号 | 作用 | 记忆口诀 |
---|---|---|
. |
匹配任意单个字符 | “点”石成金 |
* |
前边字符出现0次或多次 | 明星(*)爱重复 |
+ |
前边字符出现1次或多次 | 加(+)量必须的 |
? |
前边字符出现0或1次 | 疑问(?)有没有 |
示例:
a.*b
:匹配以a开头、b结尾,中间任意长度的字符串(如axxb, a123b)go+gle
:匹配gogle、google、gooogle等(至少1个o)
2. 字符类(精准打击必备)
表达式 | 作用 | 示例 |
---|---|---|
[abc] |
匹配a、b、c中的任意一个 | gr[ae]y 匹配gray或grey |
[^abc] |
匹配除了a、b、c的字符 | [^0-9] 匹配非数字 |
\d |
数字(等价于[0-9]) | \d+ 匹配连续数字 |
\w |
字母、数字、下划线(等价于[A-Za-z0-9_]) | 用户名常用 |
3. 量词控制(控制匹配次数)
符号 | 作用 | 示例 |
---|---|---|
{n} |
精确匹配n次 | \d{4} 匹配4位数字 |
{n,} </ |