删除相邻重复的内容

本文详细介绍如何使用正则表达式高效地删除文本中相邻重复的内容,包括字符和行,探讨了不同模式的区别及适用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、思路:用正则表达式匹配,使用反向引用,替换。查找(.+?)\1 替换为 $1
    (.+)\1 为什么不好?因为量词优先,+会尽可能地吃,然后又要一个一个吐出来,效率太差,使用(.+?)\1 取消量词优先,尽量少吃。
    (.*?)\1 为什么不好,因为.* 可以匹配没有字符的情况,.+ 要求至少有一个字符,既然是删除相邻重复的内容,当然要求至少有一个字符。

2、删除相邻重复的行,可以转化为删除相邻重复的内容。只不过中间有一个换行符,如下:查找(.+?)(\r\n)\1 替换为 $1。
   注意:这里千万不能使用(.*?)(\r\n)\1,会导致没有了换行符,为什么?
   因为 (.*?)能匹配空,紧接着换行,反向引用空,替换为空,导致换行符没有了。

3、注意:上面只是删除相邻两个重复的内容,对于多个连续重复的内容,比如:aaaa,怎么办?

    查找 (.+?)(\1)+ 替换为 $1,注意这里不能使用(.+)(\1)+,不是效率的问题,而是.+ 会多吃,导致.+ 匹配aa,最后结果为aa。

    对于多个连续重复的行,查找 (.+?)(\r\n\1)+ 替换为 $1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值