UltraEdit下的正则表达式

本文介绍了UE编辑器的强大功能及正则表达式的使用技巧,包括如何利用Perl兼容的正则表达式进行文本匹配和替换,特别展示了如何解决常见的UTF8文件BOM问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

UE是我目前熟悉的最强大的文字编辑器(先别骂,抱歉,我还没有用熟VIM,还没有学习Emac的计划),
以下可能只适用于针对比较新的版本(估计10之后)。

UE下的Regex引擎:
1,UE的土特产
   使用^p替换回车, 使用*替换多个字符,?替换单个字符
2,Unix风格的正则表达式
3,Perl兼容的正则表达式
     引擎基于Boost C++库

UE的稳定性
    中文时,太长时可能NullPointer掉,支持unicode属性集合比如\p{Space},但不支持\p{InCJKUnifiedIdeographs}等

Perl兼容下的几个Tips
1,匹配多行,默认每次一行的,类似JAVA中的(?=i)或者MULTILINE模式
  
xml 代码
 
  1. <history>(?:.|\n|\r)*history>  

   匹配多行
xml 代码
 
  1. <history>  
  2.   <book>  
  3.     fdafeafw  
  4.   book>  
  5. history>  


2, 替换掉二进制串,
比如使用UE操作UTF8文件,经常会出现该死的字符顺序标记BOM
Unicode字符集UTF16编码格式有所谓的字节顺序标记(BOM),用来确定,一个字含多个字节时,高位在前还是在后。
UTF8编码格式没有这个问题,但是很多编辑工具还是会自动生成这个标记比如Notepad,UE。。。
有这个BOM标记之后,java文件可能不能被javac编译。
可以利用Regex替换来批量去除。
regex代码
  1. (\xEF\xBB\xBF)  

Byte Order Mark (BOM). U+FEFF
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值