Python有关正则表达式的学习
文章目录
正则表达式
1、基本概念
1、使用单个字符串来描述匹配一系列符合某个语法规则的字符串
2、是对字符串操作的一种逻辑公式
3、应用场景:处理文本和数据
4、正则表达式过程:依次拿出表达式和文本中的字符作比较,如果每一个字符都匹配成功,则匹配成功,否则失败!!
正则表达式仅仅是一个文档的格式要求!对于字符串的一种约束!!大多在网上的输入,都应用到了正则表达式。基本要求:别人写的,自个能看懂,还会应用最基本的正则表达式。
2、常用操作符
将操作符进行合理的组合,构成了正则表达式
正则表达式的常用操作符(1)
操作符 | 说明 | 实例 |
---|---|---|
. |
表示任何单个字符 | |
[] |
字符集,对单个字符给出取值范围 | [abc] 表示a、b、c,[a-z] 表示a到z单个字符 |
[^ ] |
非字符集,对单个字符给出排除范围 | [^abc] 表示非a或b或c的单个字符 |
* |
表示对*前面的字符限制次数为0次或者无限次 | abc* 表示:ab\abc\abcc\abccc |
+ |
表示对*前面的字符限制次数为1次或者无限次 | abc+ 表示:abc\abcc\abccc |
? |
表示前一个字符出现0次或者一次 | abc? 表示:ab、abc |
| |
表示左右表达式任意一个 | abc|def 表示:abc、def |
正则表达式的常用操作符(2)
操作符 | 说明 | 实例 |
---|---|---|
{m} |
拓展前面一个字符m次 | ab{2}c 表示:abbc |
{m,n} |
拓展前面一个字符出现[m,n]次 | ab{1,2}c 表示:abc或abbc |
^ |
匹配字符串开头,以XX开头 | ^abc 表示以abc开头的字符串,才能匹配上 |
$ |
匹配字符串结尾,以XX结尾 | abc$ 表示以abc结尾的字符串,才能匹配上 |
() |
分组标记,内部职能用| 操作符 |
(abc) 表示abc,(abc|def) 表示abc、def |
\d |
数字,等价于从(0-9)的所有数字,只表示一位 | |
\w |
单词字符,等价于[A-Z a-z 0-9_] |
正则表达式的其它补充:https://www.cnblogs.com/fozero/p/7868687.html
3、re模块
使用正则表达式,必须导入
import