字符串处理与序列化全解析
1. 正则表达式基础
正则表达式是处理字符串模式匹配的强大工具。在正则表达式里,有很多特殊的字符和规则。
- 转义字符 :两个字符 \.
能匹配单个 .
字符。若缺少这个句号字符或者是其他字符,就无法匹配。反斜杠转义序列在正则表达式中用于多种特殊字符,例如用 \[
插入方括号而不开启字符类,用 \(
插入括号,括号也是特殊字符。此外,还能用转义符号加字符来表示特殊字符,像 \n
代表换行符, \t
代表制表符。部分字符类可以用转义字符串更简洁地表示,如 \s
表示空白字符, \w
表示字母、数字和下划线, \d
表示数字。示例如下:
- '(abc]'
匹配模式 '\(abc\]'
- ' 1a'
匹配模式 '\s\d\w'
- '\t5n'
不匹配模式 '\s\d\w'
- '5n'
匹配模式 '\s\d\w'
- 匹配多个字符 :借助上述信息,能匹配大多数已知长度的字符串,但多数时候我们并不清楚模式里要匹配多少个字符。正则表达式也能处理这种情况,可通过在模