NotePad++ 正则表达式

本文详细介绍正则表达式的各种符号及其应用场景,并提供了查找与替换的实际案例,帮助读者掌握正则表达式的使用技巧。

在我们处理文件时,很多时候会用到查找与替换。当我们想将文件中某一部分替换替换文件中另一部分时,怎么办呢? 下面正则表达式 给我提供方法。

正则表达式,提供复杂 并且弹性的查找与替换

注意: 不支持多行表达式 (involving \n, \r, etc).

1 基本表达式

符号解释
.匹配任意字符,除了新一行(\n)。也就是说 “.”可以匹配 \r ,当文件中同时含有\r and \n时,会引起混乱。要匹配所有的字符,使用\s\S。
(…)这个匹配一个标签区域. 这个标签可以被访问,通过语法 \1访问第一个标签, \2 访问第二个, 同理 \3 \4 … \9。 这些标签可以用在当前正则表达式中,或则替search和replace中的换字符串。
\1, \2, etc在替换中代表1到9的标签区域(\1 to \9)。例如, 查找字符串 Fred([1-9])XXX 并替换为字符串 Sam\1YYY的方法,当在文件中找到Fred2XXX的字符串时,会替换为Sam2YYY。注意: 只有9个区域能使用,所以我们在使用时很安全,像\10\2 表示区域1和文本”0”以及区域2。
[…]表示一个字符集合, 例如 [abc]表示任意字符 a, b or c.我们也可以使用范围例如[a-z] 表示所以的小写字母。
[^…]表示字符补集. 例如, [^A-Za-z] 表示任意字符除了字母表。
^匹配一行的开始(除非在集合中, 如下).
$匹配行尾.
*匹配0或多次, 例如 Sa*m 匹配 Sm, Sam, Saam, Saaam 等等.
+匹配1次或多次,例如 Sa+m 匹配 Sam, Saam, Saaam 等等.
?匹配0或者1次, 例如 Sa?m 匹配 Sm, Sam.
{n}匹配确定的 n 次.例如, ‘Sa{2}m’ 匹配 Saam.
{m,n}匹配至少m次,至多n次(如果n缺失,则任意次数).例如, ‘Sa{2,3}m’ 匹配 Saam or Saaam. ‘Sa{2,}m’ 与 ‘Saa+m’相同
*?, +?, ??, {n,m}?非贪心匹配,匹配第一个有效的匹配,通常 ‘<.>’ 会匹配整个 ‘content’字符串 –但 ‘<.?>’ 只匹配 ” .这个标记一个标签区域,这些区域可以用语法\1 \2 等访问多个对应1-9区域。

2 标记和分组

符号解释
(…)一组捕获. 可以通过\1 访问第一个组, \2 访问第二个.
(?:…)非捕获组.
(?=…)非捕获组 – 向前断言. 例如’(.*)(?=ton)’ 表达式,当 遇到’Appleton’字符串时,会匹配为’Apple’.
(?<=…)非捕获组 – 向后断言. 例如’(?<=sir) (.*)’ 表示式,当遇到’sir William’ 字符串时,匹配为’ William’.
(?!…)非捕获组 – 消极的向前断言. 例如’.(?!e)’ 表达式,当遇到’Apple’时,会找到每个字母除了 ‘l’,因为它紧跟着 ‘e’.
(?非捕获组 – 消极向后断言. 例如 ‘(?
(?P…)命名所捕获的组. 提交一个名称到组中供后续使用,例如’(?PA[^\s]+)\s(?P=first)’ 会找到 ‘Apple Apple’. 类似的 ‘(A[^\s]+)\s\1’ 使用组名而不是数字.
(?=name)匹配名为name的组. (?P…).
(?#comment)批注 –括号中的内容在匹配时将被忽略。

3 特殊符号

符号解释
\s匹配空格. 注意,会匹配标记的末尾. 使用 [[:blank:]] 来避免匹配新一行。
\S匹配非空白
\w匹配单词字符
\W匹配非单词字符
\d匹配数字字符
\D匹配非数字字符
\b匹配单词边界. ‘\bW\w+’ 找到W开头的单词
\B匹配非单词边界. ‘\Be\B+’ – 找到位于单子中间的字母’e’
\<This matches the start of a word using Scintilla’s definitions of words.
>This matches the end of a word using Scintilla’s definition of words.
\x运行用x来表达可能具有其他意思的字符。例如, [ 用来插入到文本中作为[ 而不是作为字符集的开始.

4 字符类

符号解释
[[:alpha:]]匹配字母字符: [A-Za-z]
[[:digit:]]匹配数字字符: [0-9]
[[:xdigit:]]匹配16进制字符: [0-9A-Fa-f]
[[:alnum:]]匹配字母数字字符: [0-9A-Za-z]
[[:lower:]]匹配小写字符: [a-z]
[[:upper:]]匹配大写字符: [A-Z]
[[:blank:]]匹配空白 (空格 or tab):[ \t]
[[:space:]]匹配空白字符:[ \t\r\n\v\f]
[[:punct:]]匹配标点字符: [-!”#$%&’()*+,./:;<=>?@[]_`{
[[:graph:]]匹配图形字符: [\x21-\x7E]
[[:print:]]匹配可打印的字符 (graphical characters and spaces)
[[:cntrl:]]匹配控制字符

5 替换操作

使用正则表达式的标记,通过()来包围想要用的字符,然后用\1 来替换字符串,第一个匹配文本。

例如:

Text bodySearch stringReplace stringResult
Hi my name is Fredmy name is (.+)my name is not \1Hi my name is not Fred
The quick brown fox jumped over the fat lazy dogbrown (.+) jumped over the (.+)brown \2 jumped over the \1The quick brown fat jumped over the fox lazy dog

6 限制

Support for regular expressions in PN2 is currently limited, the supported patterns and syntax are a very small subset of the powerful expressions supported by perl. 最大的限制是正则表达式只能匹配单行,不能用多行匹配表达。可以用Backslash Expressions代替.

准备计划是使用PCRE库 library (used elsewhere in PN2) 来支持文档搜索.

原文:http://www.pnotepad.org/docs/search/regular_expressions/

7应用举例

删除空白行的方法
方法:
选择替换,把查找模式设置为正则表达式,在查找框中输入 ^\s+  ,替换框留空,点“全部替换”,即可(先全选)。
删除所有行s字符开始后面的所有字符
方法:
选择替换,把查找模式设置为正则表达式,在查找框中输入 ^([^:]*):.*$,替换框填写$1,点“全部替换”,即可(先全选)。

转载于:https://www.cnblogs.com/YiShen/p/9768461.html

### 解决 Notepad++正则表达式替换失败的方法 当遇到 Notepad++正则表达式替换不成功的情况时,通常是因为编码设置不当或正则表达式的写法不符合预期。为了确保正则表达式能够正常工作,在操作之前应先确认文件的编码格式已正确转换为 UTF-8[^1]。 #### 文件编码转换 在执行任何基于字符集的操作前,建议将文档保存并转换为无 BOM 的 UTF-8 编码。具体步骤如下: 1. 打开目标文件; 2. 选择菜单栏中的 **“编码”** -> **“转为 UTF-8 编码 (without BOM)”** 或者直接点击状态栏上的当前编码选项进行切换; 这样做的目的是为了避免因不同编码方式下相同字符的不同表示形式而导致匹配错误。 #### 使用正确的正则表达式语法 对于特定场景下的字符串匹配,比如中文字符范围内的查找与替换,应该采用适合该语言环境的正则表达式模式。例如,要匹配所有的汉字,可以使用 `[\x{4e00}-\x{9fa5}]` 这样的 Unicode 属性类来定义[^2]。 另外需要注意的是,“.” 符号默认情况下不会匹配换行符 `\n` 。如果希望它能跨越多行,则需指定相应的修饰符或将 “.” 改为 `[.\s\S]` 来代替[^3]。 #### 实际案例分析 假设有一个列表包含了多个景点名称及其编号,并希望通过正则表达式去除这些数字标签。原始数据如下所示[^4]: ```plaintext 11龙门石窟,12云冈石窟,13敦煌莫高窟,... ``` 此时可利用以下正则表达式来进行批量处理: ```regex \d+(?=([^\d]*)) ``` 此表达式的含义是从左至右寻找连续的一串数字(即景点前面的序号),并且后面紧跟着非数字的内容。找到后将其替换成空字符串即可达到目的。 通过上述调整和优化后的配置参数以及合理的正则表达式编写习惯,可以在很大程度上提高 Notepad++正则表达式工作的成功率。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值