《java解惑》——续字符串之谜

本文探讨了Java中字符串替换方法的使用,包括解决正则表达式误操作导致的问题,以及实现跨平台的字符串替换策略。通过实例分析,展示了如何在不同操作系统环境下正确处理路径分隔符。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.字符串替换:

问题:

下面这段程序把类全路经名中的"."替换为"/",代码如下:

[java]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. package com.javapuzzlers;  
  2.   
  3. public class Test {  
  4.   
  5.     public static void main(String[] args){  
  6.         System.out.println(Test.class.getName().replaceAll(".""/") + ".class");  
  7.     }  
  8. }  
原本期望输出的结果是:com/javapuzzlers/test.class,但是程序运行真正的输出是://///////////////////.class。

原因:

String.replaceAll方法接受一个正则表达式作为它的第一个参数,而并非一个字符序列字面常量,正则表达式"."可以匹配任意单个字符,因此类名中的每一个字符都被替换成了斜杠,也就是我们意想不到的结果。

结论:

解决这个问题有两个方法:

方法一:

在正则表达式中的句点前面添加一个反斜杠"\"进行转义,由于反斜杠在正则表达式中表示转义字符的开始,因此反斜杠自身也必须使用另一个反斜杠来转义,代码如下:

[java]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. package com.javapuzzlers;  
  2.   
  3. public class Test {  
  4.   
  5.     public static void main(String[] args){  
  6.         System.out.println(Test.class.getName().replaceAll("\\.""/") + ".class");  
  7.     }  
  8. }  
方法二:

JDK5之后引入了java.util.regex.Pattern.quote方法,用于接受一个字符串作为参数,并可以添加必需的转义字符,从而将其返回一个正则表达式字符串,该字符串将精确匹配输入的字符串,代码如下:

[java]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. package com.javapuzzlers;  
  2.   
  3. import java.util.regex.Pattern;  
  4.   
  5. public class Test {  
  6.   
  7.     public static void main(String[] args){  
  8.         System.out.println(Test.class.getName().replaceAll(Pattern.quote("."), "/") + ".class");  
  9.     }  
  10. }  


2.跨平台的字符串替换:

问题:

第一个例子中我们把类名全路经中的句点替换为Unix/Linux文件路径斜杠,但是如果在Windows操作系统中,文件的分隔是反斜杠,因此上述程序不具有跨平台性,在JDK的java.io.File.separator被定义为一个公有域,用于指定操作系统平台相关的文件路径分隔符(Unix/Linux中是斜杠,Windows中是反斜杠),因此我们程序修改一下,使用java.io.File.separator来写出跨平台的程序如下:

[java]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. package com.javapuzzlers;  
  2.   
  3. import java.io.File;  
  4. import java.util.regex.Pattern;  
  5.   
  6. public class Test {  
  7.   
  8.     public static void main(String[] args){  
  9.         System.out.println(Test.class.getName().replaceAll(Pattern.quote("."), File.separator) + ".class");  
  10.     }  
  11. }  
经测试,改程序在Unix/Linux平台上运行正常,打印出com/javapuzzlers/test.class,而在Windows平台上我们原本期望输出com\javapuzzlers\Test.class,但是报如下运行时异常:

Exception in thread "main" java.lang.StringIndexOutOfBoundsException: String index out of range: 1
at java.lang.String.charAt(String.java:658)
at java.util.regex.Matcher.appendReplacement(Matcher.java:762)
at java.util.regex.Matcher.replaceAll(Matcher.java:906)
at java.lang.String.replaceAll(String.java:2162)
at com.javapuzzlers.Test.main(Test.java:9)

分析:

在Windows平台之所以出现运行时异常,是因为String.replaceAll方法的第二个参数不是一个普通的字符串,而是一个替代字符串,在java.util.regex规范中规定,在替代字符串中出现的反斜杠会把紧随其后的字符进行转义,从而导致其被按字面含义处理了。

在JDK5之后,有两种方法解决该问题:

方法一:

使用java.util.regex.Matcher.quoteReplacement方法将字符串转换成相应的替代字符串,代码如下:

[java]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. package com.javapuzzlers;  
  2.   
  3. import java.io.File;  
  4. import java.util.regex.Matcher;  
  5. import java.util.regex.Pattern;  
  6.   
  7. public class Test {  
  8.   
  9.     public static void main(String[] args){  
  10.         System.out.println(Test.class.getName().replaceAll(Pattern.quote("."), Matcher.quoteReplacement(File.separator)) + ".class");  
  11.     }  
  12. }  
方法二:

使用String.replace方法替代String.replaceAll方法,这两个方法功能相同,不同之处在于replace方法接受的两个参数都当作字面含义字符串处理,而非正则表达式,代码如下:

[java]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. package com.javapuzzlers;  
  2.   
  3. import java.io.File;  
  4.   
  5. public class Test {  
  6.   
  7.     public static void main(String[] args){  
  8.         System.out.println(Test.class.getName().replace(".", File.separator) + ".class");  
  9.     }  
  10. }  

如果使用的是JDK5之前的老版本JDK,则可以使用String.replace(char, char)方法来解决这一问题,代码如下:

[java]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. package com.javapuzzlers;  
  2.   
  3. import java.io.File;  
  4.   
  5. public class Test {  
  6.   
  7.     public static void main(String[] args){  
  8.         System.out.println(Test.class.getName().replace('.', File.separatorChar) + ".class");  
  9.     }  
  10. }  


3.另类诡异的标号:

问题:

下面的程序能否通过编译,输出结果是什么:

[java]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. public class Test {  
  2.   
  3.     public static void main(String[] args){  
  4.         System.out.print("iexplore:");  
  5.         http://www.google.com  
  6.         System.out.println(":maximize");  
  7.     }  
  8. }  
改程序可以正常通过编译,输出结果为:iexplore::maximize。

原因:

咋一看在程序中添加了一句十分诡异的“http://www.google.com”让很多人琢磨不定,该URL的前面部分“http:”被当作了java语言中内置的标号(没有goto语句,用于标识跳转位置的标号),后面部分被当作了单行注释。

结论:

很多人可能在java编程中极少碰到标号,但要记得有这样一个java语法特性,如果想要使的程序看起来更加容易理解,最好把程序格式化,将标号和注释分开,代码如下:

[java]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. public class Test {  
  2.   
  3.     public static void main(String[] args) {  
  4.         System.out.print("iexplore:");  
  5.     http:   // www.google.com  
  6.         System.out.println(":maximize");  
  7.     }  
  8. }  

4.字符串拼接:

问题:

猜猜下面程序的打印输出结果:

[java]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. import java.util.Random;  
  2.   
  3. public class Test {  
  4.       
  5.     private static Random rnd = new Random();  
  6.   
  7.     public static void main(String[] args) {  
  8.         StringBuffer word = null;  
  9.         switch(rnd.nextInt(2)){  
  10.             case 1: word = new StringBuffer('P');  
  11.             case 2: word = new StringBuffer('G');  
  12.             default: word = new StringBuffer('M');  
  13.         }  
  14.         word.append('a');  
  15.         word.append('i');  
  16.         word.append('n');  
  17.         System.out.println(word);  
  18.     }  
  19. }  

有人觉得可能该程序在多次运行中,以相等的概率分别打印输出Pain,Gain和Main,也有可能任务switch的case穿透,因此该程序应该总打印输出Main。

改程序的真实运行结果总是令人奇怪的ain。

原因:

之所以出现这种令人惊异的运行结果是因此改程序总共有3个bug,这3个bug碰巧凑到一块引发令人惊异的结果。

第一个bug:选取的伪随机数使的switch语句只能达到其三种情况中的两种,Random.nextInt(int)的规范描述返回一个伪随机数均匀分布在从0(包括)到指定数值(不包括)之间的一个int数值,因此Random.nextInt(2)取值只能为0和1,不可能为2,因此switch的2分支永远不可能执行,若想要达到2,则必须将伪随机数修改为Random.nextInt(3)。

第二个bug:switch的case语句没有break,因此总会穿透顺序执行到default语句,即总会执行word = new StringBuffer('M');覆盖前面的程序赋值。

第三个bug:StringBuffer根本没有StringBuffer(char)构造函数,StringBuffer只有如下三个构造函数:

(1).默认无参数构造函数:StringBuffer();

(2).指定字符串初始缓冲区内容的构造函数:StringBuffer(String);

(3).指定字符串初始缓冲区初始容量的构造函数:StringBuffer(int);

当使用word = new StringBuffer('M');时,编译器会将字符M自动类型转换为int数值77,从而选择第三个构造函数,因此改程序总打印输出ain也就不难理解了。

结论:

有三种办法修改上述程序:

方法一,修改程序bug:

[java]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. import java.util.Random;  
  2.   
  3. public class Test {  
  4.       
  5.     private static Random rnd = new Random();  
  6.   
  7.     public static void main(String[] args) {  
  8.         StringBuffer word = null;  
  9.         switch(rnd.nextInt(3)){  
  10.             case 1: word = new StringBuffer("P");  
  11.             break;  
  12.             case 2: word = new StringBuffer("G");  
  13.             break;  
  14.             default: word = new StringBuffer("M");  
  15.             break;  
  16.         }  
  17.         word.append('a');  
  18.         word.append('i');  
  19.         word.append('n');  
  20.         System.out.println(word);  
  21.     }  
  22. }  
方法二,精简版:

[java]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. import java.util.Random;  
  2.   
  3. public class Test {  
  4.       
  5.     private static Random rnd = new Random();  
  6.   
  7.     public static void main(String[] args) {  
  8.         System.out.println("PGM".charAt(rnd.nextInt(3)) + "ain");  
  9.     }  
  10. }  
方法三:

[java]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. import java.util.Random;  
  2.   
  3. public class Test {  
  4.       
  5.     private static Random rnd = new Random();  
  6.   
  7.     public static void main(String[] args) {  
  8.         String[] a = {"Main""Pain""Gain"};  
  9.         System.out.println(randomElement(a));  
  10.     }  
  11.       
  12.     private static String randomElement(String[] a){  
  13.         return a[rnd.nextInt(a.length)];  
  14.     }  
  15. }  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值