正则表达式,关于String.replaceALL()

本文详细解析了Java中使用正则表达式进行字符串替换的常见问题及解决方案,包括如何正确使用replaceAll方法处理特殊字符,例如斜杠、美元符号等。

原文:http://blog.youkuaiyun.com/gqm1982/archive/2007/06/09/1645702.aspx

今天写程序,遇到URI的“/”转换问题,看到String有replaceAll()函数就直接用了,但eclipse却一直报错,也不知道为什么,郁闷了半天。在gg上搜索一下,看了半天,终于明白是正则表达式的问题,下面是我找的解决文章。比较乱,大家耐心看吧。

class t1 {
public static void main(String a[]) {
String s = 'E:\\jbx\\x9\\io9';
String ss;
//把路径s中的'\'换为'\\',为何还要整8个'\'?我以为4个就行了。
ss = s.replaceAll('\\\\', '\\\\\\\\ System.out.println('s= ' + s);
System.out.println('ss=' + ss);
//output:
//s= E:\jbx\x9\io9
//ss=E:\\jbx\\x9\\io9
}
}

这里的关键是String.replaceAll()是用regular expression 来作为参数的。但是java本身的字符串对于转义符\也有类似的处理。首先,java会把“\\\\”解释成一个字符串(其中包含两个char)——“\\”这个就是你在JDK的文档里看到的。
接下来,由于replaceAll是以正则表达式作为参数,所以“\\”被解释成一个regex。对于一个regex来说这就代表着一个字符,就是“\”。对后面的那个8个\来说,最终会被解释成“\\”。

换言之,假设String.replaceAll()是以普通字符串,而不是regex作为参数,那么这样写代码: String target = source.replaceAll('\\', '\\\\'); 就可以了。

===============================
在replaceAll(String,String)方法中需要特殊处理英文状态的括号,在网上找了一下,可以使用下面的写法将英文括号替换成其他字符(比如中文全角括号):str1.replaceAll("\\(","(");

在java中要将一个字符串的中$符号去除。我是这样写的:
String tmp = "-$125402.00";
tmp.replaceAll("$","");
可是执行去来的结果并没有把$去除。后来找资料才发现要这样写
tmp.replaceAll("\\$","")才可以。

String replaceAll(String regex, String replacement)中的两个参数都是regex。尤其是当第二个参数replacement是用户输入或指定的字符串时,如果其中包含regex特殊字符(主要是\和$)而不加注意,就容易导致问题引发异常。这种情况下如果只是简单的字符串替换而无需regex引擎参与的话,就不要用replaceAll好了。JDK1.5中加入了String replace(CharSequence target, CharSequence replacement),可以用它。JDK1.4或以下,自己搞一个好了,如oldReplace: http://www.javapractices.com/Topic80.cjp
在写程序的时候,需要将"\"字符写入一个文本文件,开始以为这不是个什么问题,转换一下就好了嘛,代码如下:

targetPath = targetPath.replaceAll("\\", "\\\\");
fileOperate.createFile(fileName, targetPath);

原以为没有问题,这样就可以先在读入的字符串中把"\"转换为"\\",然后在写入文本文件时就会写成"\",没想到,报如下错误:

java.util.regex.PatternSyntaxException: Unexpected internal error near index 1
\

回来查了资料才发现,java的replaceAll函数,使用的是正则表达式作为转换依据,而"\"在正则表达式中也是特殊字符,最后,写成下面的代码才达到了我预想的目的:

targetPath = targetPath.replaceAll("\\\\", "\\\\\\\\");
fileOperate.createFile(fileName, targetPath);

replace和replaceAll方法的区别:

主要就是后者是基于规则表达多的替换,而前者是一般的基于字符或字符序列本身的替换。

比如,可以通过replaceAll("\\d", "*")把一个字符串所有的数字字符都换成星号,replace就做不到,因为它不是基于规则表达多的替换。

在 Java 中,`String.replaceAll()` `StringUtils.replaceAll()` 是两个用于字符串替换的方法,但它们之间存在显著的差异,包括底层实现、功能扩展以及使用场景。 ### 三、方法来源与功能对比 `String.replaceAll()` 是 Java 原生 `String` 类的一个方法,它基于正则表达式进行匹配替换。其语法为: ```java public String replaceAll(String regex, String replacement) ``` 该方法将字符串中所有与正则表达式 `regex` 匹配的部分替换为指定的替换字符串 `replacement` [^2]。 相比之下,`StringUtils.replaceAll()` 来自 Apache Commons Lang 库中的 `StringUtils` 工具类。虽然它的作用与 `String.replaceAll()` 类似,但它提供了更友好的 API 设计更强的空值处理能力。例如,该方法在输入字符串为 `null` 时不会抛出异常,而是直接返回 `null`,从而减少了显式的空值检查需求。 ### 四、正则表达式依赖 `String.replaceAll()` 的一个关键特性是它依赖于正则表达式进行匹配。这意味着如果传入的 `regex` 参数包含特殊字符(如 `.`, `*`, `+`, `?` 等),必须进行转义处理,否则可能导致意外行为或安全漏洞 [^1]。 而 `StringUtils.replaceAll()` 在内部依然调用了 `String.replaceAll()`,因此它同样依赖于正则表达式。然而,Apache Commons 提供了其他非正则版本的方法,如 `StringUtils.replace()`,用于简单的字面量替换,不涉及正则表达式解析,适用于不需要复杂模式匹配的场景。 ### 五、异常处理与健壮性 由于 `String.replaceAll()` 是基于正则表达式的,当传入的 `regex` 参数无效时,会抛出 `PatternSyntaxException` 异常。这要求开发者在使用时必须确保正则表达式的合法性,否则可能引发运行时错误 [^4]。 而 `StringUtils.replaceAll()` 没有从根本上改变这一机制,但由于它是工具类的一部分,通常与其他辅助方法一起使用,开发者可以在调用对参数进行更全面的校验,提高代码的健壮性。 ### 六、性能考量 从性能角度来看,两者在底层都依赖于相同的正则表达式引擎(Java 的 `Pattern` `Matcher` 类),因此在执行效率上差异不大。但在某些特定场景下,例如仅需替换固定字符串而非正则模式时,应优先使用 `StringUtils.replace()` 或 `String.replace()`,以避免不必要的正则编译开销。 ### 七、使用建议 - 如果需要进行基于正则表达式的全局替换,并且输入数据已知有效,则可以使用 `String.replaceAll()`。 - 如果项目中已经引入了 Apache Commons Lang,并且希望增强代码的可读性健壮性,特别是在处理可能为空的字符串时,推荐使用 `StringUtils.replaceAll()`。 - 对于不需要正则表达式的简单替换操作,应使用 `String.replace(CharSequence target, CharSequence replacement)`,它按字面量进行替换,不会引发正则相关的异常或性能问题 [^1]。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值