字符串split操作到底有多少坑

微信公众号

微信公众号
长字符串切分,取其中元素封装或者将封装信息组合成长字符串都是常规操作,但是这种长字符串往往是不可控的,如一个长字符串就是由一个元素组成,或者存在空字符串的元素,看似这并没有什么问题,但是使用不同工具类的split方法进行切分结果是完全不同的。不知道你是否遇到这样的坑,下面一起来看看。

String类自带的split方法

直接使用String本身自带的split方法,看对不同字符串的切分结果。

  • 没有分隔符的字符串

    //str = "1"
    public static void split2(String str) {
      String[] splits = str.split(",");
      for (String split : splits) {
          System.out.println("->" + split);
      }
      System.out.println("数组长度:" + splits.length);
    }

    切分后结果是单个元素["1"],数组长度是1。

  • 有分隔符,分隔符切分后没有空字符串出现

    //str = "1,2"
    //代码同上……

    切分后结果是["1","2"],数组长度是2。(假设分隔符是n个,分割后的元素个数是n+1个)

  • 有分隔符,分隔符切分后有空字符串出现

    //str = "1,,2"
    //代码同上……

    切分后结果是["1","","2"],数组长度是3。(假设分隔符是n个,分割后的元素个数是n+1个)

最终总结不管分隔符有多少个,最终切分的结果都是n+1个元素。也是正常业务逻辑所需要的。但是这里有一个问题,如果传入的字符串是null的时候会报NullPointException异常,需要另外加一层非空判断。

commons提供的StringUtils工具类

具体全限定类名是org.apache.commons.lang3.StringUtils,这个可以说是最常用一个字符串的工具类。如判断非null、非空字符串或者非空格,用isNotBlank方法,使用集合元素组装字符串,用join方法等等。现在来看一下split方法在不同的情况下是如何实现。

  • 没有分隔符的字符串

    //str = "1"
    public static void split1(String str) {
      String[] splits = org.apache.commons.lang3.StringUtils.split(str, ",");
      for (String split : splits) {
          System.out.println("->" + split);
      }
      System.out.println("数组长度:" + splits.length);
    }

    切分后的结果是单个元素["1"],数组长度为1。

  • 有分隔符,分隔符切分后没有空字符串出现

    //str = "1,2"
    //代码同上……

    切分后的结果是两个元素["1","2"],数组长度为2。

  • 有分隔符,分隔符切分后有空字符串出现

    //str = "1,,2"
    //代码同上……

    切分后的结果和上一种情况结果是一样的,也是两个元素["1","2"],数组长度为2。

从这里就可以看的出来问题的所在,当出现空字符串的时候,会自动将空字符串丢弃,只保留非空字符串。但是这里还是需要注意的是如果是空格,也会形成一个元素。比如现在str输入的是"1, ,2",两个分隔符间有一个空格,此时就会切分成三个元素。

Spring下util包提供的StringUtils工具类

全限定类名org.springframework.util.StringUtils,这个StringUtils也经常被用到,因为在输入StringUtils的时候,IDEA自动提示,往往它就是在第一位。那它和上面两种在split方法上有什么不同呢?

  • 没有分隔符的字符串

    //str = "1"
    public static void split3(String str) {
      String[] splits = org.springframework.util.StringUtils.split(str, ",");
      for (String split : splits) {
          System.out.println("->" + split);
      }
      System.out.println("数组长度:" + splits.length);
    }

    这个时候对不起,会报NullPointerException异常,也就是这个split方法必须要有分隔符的存在。

  • 有分隔符,分隔符切分后没有空字符串出现

    //str = "1,2"
    //代码同上……

    切分后的结果是两个元素["1","2"],数组长度为2。

  • 有分隔符,分隔符切分后有空字符串出现

    //str = "1,,2"
    //代码同上……

    切分后的结果是两个元素["1",",2"],数组长度为2。看到这里可能你会认为我这个数组格式写错了,但是实际上第二个元素的确是这样的,确定无疑。

这个split方法还是很坑的,它会从字符串中找分隔符是否存在,如果不存在直接报错,如果存在,不管有多少个分隔符,都是以第一个分隔符做切分,最终形成两个元素。

总结

三个split方法三种不同的切分逻辑,到底在什么时候用那种方式切分就很讲究了,因为在开发过程中因为这个切分出过很多莫名其妙的BUG。我就遇到过两次。

  • 第一次是使用的org.apache.commons.lang3.StringUtils来切分字符串,字符串内有空字符串存在,导致切割后的元素个数和实际个数不同,准确的来说少了元素,结果代码中在向另一个字符串占位符中填充数据的时候,总是出现错位的现象。(如本来应该放在占位符3位置上的字符串出现为空字符串,在切分的时候,3位置的元素实际被抛弃,4位置的元素放在了3的位置)
  • 第二次也是使用的org.apache.commons.lang3.StringUtils来切分字符串,测试一直都是很正常,但是测试一段时间后,发现报NullPointException,排查后才发现,引入的StringUtils被其他开发人员换成了org.springframework.util.StringUtils导致的。因为这个字符串可能没有分隔符。
### Python `rsplit` 函数详解 #### 常见问题和注意事项 当处理字符串分割操作时,`rsplit()` 方法提供了从右向左进行拆分的功能。此方法的行为与 `split()` 类似,但区别在于它从右侧开始计算并执行分割动作[^1]。 对于未提供分隔符的情况,默认情况下会去除空白字符作为分隔标志,并返回由非空部分组成的列表;然而,如果指定了分隔符,则仅该符号会被用于切割逻辑。 需要注意的是,即使在源字符串中找不到指定的分隔符,整个原始字符串也会作为一个整体元素出现在结果列表里。 ```python s = "hello world Python" print(s.rsplit()) # 默认按任意数量的连续空白字符分割 ``` #### 错误用法及其解决方案 一种常见的错误发生在尝试使用不存在于目标字符串中的分隔符时: ```python # 错误示范 text = "hello_world_Python" result = text.rsplit("|") # 使用了不在字符串中存在的分隔符 "|" print(result) # 输出 ["hello_world_Python"] ``` 为了避免这种情况发生,应该确保所提供的分隔符确实存在于待处理的字符串内,或者考虑是否真的需要指定分隔符。如果不希望依赖特定分隔符而只是简单地依据空白来划分词语,可以省略参数让其自动识别空白区域。 另一个容易犯错的地方是在设置 `maxsplit` 参数的时候。这个参数决定了最多能有多少分割操作被执行。一旦达到了设定的最大次数,剩下的全部内容将会保持不变成为最后一个条目的一部分。因此,合理规划 `maxsplit` 的数值非常重要,以达到预期的效果。 ```python # 正确示范 example_string = "apple,banana,cherry,date" correct_usage = example_string.rsplit(",", maxsplit=2) print(correct_usage) # 结果为 ['apple,banana', 'cherry', 'date'] ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值