Editplus替换HTML标签的正则表达式(转)

本文深入解析了正则表达式中的基本元素及其应用,包括制表符、新行、任意字符匹配、特定字符匹配、重复匹配、边界匹配等。详细解释了如何利用这些元素进行复杂的字符串匹配和替换操作,以及在实际开发中如何解决正则表达式跨行匹配的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 原文地址: http://blog.sina.com.cn/s/blog_4384a04e0100lp2a.html

 

只一句,仅一句:

<[^>]*>

 

拆解开:

<*>

[^>]


解说:
1、<*>:匹配“<”开始,到最后一个“>”;
2、[^>]:除了“>”这个符号,都匹配;
整个的意思:匹配“<”开始,一直往后匹配,除了遇到“>”这个符号的字符全部匹配中,然后最后匹配到一个“>”,即:<xxxxxxxx(这里不包括“>”,如果包括“>”则*号的任务完成,即截止在“>”之前)然后再匹配上“>”符。

 

网络上的Editplus正则,长篇大论,都是牛人写的……

-----------------
Editplus只支持以下正则:
\t 制表符
\n 新行
匹配任意字符
匹配表达式左边和右边的字符. 例如, "ab|bc" 匹配 "ab" 或者 "bc"
[] 匹配列表之中的任何单个字符. 例如, "[ab]" 匹配 "a" 或者 "b". "[0-9]" 匹配任意数字
[^] 匹配列表之外的任何单个字符. 例如, "[^ab]" 匹配 "a" 和 "b" 以外的字符. "[^0-9]" 匹配任意非数字字符
其左边的字符被匹配任意次(0次,或者多次). 例如 "be*" 匹配 "b", "be" 或者 "bee"
其左边的字符被匹配至少一次(1次,或者多次). 例如 "be+" 匹配 "be" 或者 "bee" 但是不匹配 "b"
其左边的字符被匹配0次或者1次. 例如 "be?" 匹配 "b" 或者 "be" 但是不匹配 "bee"
其右边的表达式被匹配在一行的开始. 例如 "^A" 仅仅匹配以 "A" 开头的行
$ 其左边的表达式被匹配在一行的结尾. 例如 "e$" 仅仅匹配以 "e" 结尾的行
() 影响表达式匹配的顺序,并且用作表达式的分组标记
转义字符. 如果你要使用 "\" 本身, 则应该使用 "\\"

不支持跨行匹配,比如别想区配:
<a

href=...></a>

中间过渡解决方案:
先用正则,把换行替换成一个页面里没有的字符,比如“●”,使所有数据在同一行,然后要怎么做就怎么做吧,最后把特殊字符再换回成换行。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值