Java字符串分割函数split中以·点分割的问题

本文深入解析Java中使用split函数按特定字符分割字符串的过程,特别是针对正则表达式中特殊字符的处理方式。通过实例演示如何避免常见错误,并解释了split函数内部实现原理。

问题描述:

// 把字符串"192.168.1.1"按照小圆点进行分割,分割成"192","168","1","1"四个字符串。

String preStr = "192.168.1.1"; 

String[] string = preStr.split("."); // 错误写法。这种写法得到的字符串组长度为0

String[] string = preStr.split("\\."); //正确写法。对小圆点进行转义


出现上述情况的原因是:split函数会将参数看作是正则表达式进行处理。"."在正则表达式中表示匹配任意一个字符,经过转义之后,"."才是本身的含义,才能得到正确的分割结果。下面主要探讨上述错误写法中得到的字符串组为什么大小为0。

下面是split函数源代码(java.util.regex.Pattern.split

public String[] split(CharSequence input, int limit) {
		int index = 0;
		boolean matchLimited = limit > 0; // 是否限制匹配个数
		ArrayList<String> matchList = new ArrayList<String>(); // 匹配结果队列
		Matcher m = matcher(input); // 待切割字符(串)匹配对象
		// Add segments before each match found
		while (m.find()) {
			// 如果不限制匹配个数 或者 当前结果列表的大小小于limit-1
			if (!matchLimited || matchList.size() < limit - 1) {
				String match = input.subSequence(index, m.start()).toString(); // 取子串,(分隔串所在的首位)
				matchList.add(match); // 添加进结果集
				index = m.end(); // 获取下一个子串的首字符下标
			} else if (matchList.size() == limit - 1) { // last one,即还剩最后一个名额了
				// 最后一个元素从指针取到字符串结尾
				String match = input.subSequence(index, input.length()).toString();
				matchList.add(match);
				index = m.end();
			}
		}
		// If no match was found, return this
		if (index == 0) // 即没有切分到的意思吧,返回整一串
			return new String[] { input.toString() };
		// 如果不限制匹配个数 或者结果集大小小于限制个数
		if (!matchLimited || matchList.size() < limit)
			// 最后一个元素从指针取到字符串结尾
			matchList.add(input.subSequence(index, input.length()).toString()); // Construct
		// result
		int resultSize = matchList.size();
		if (limit == 0)
			// 如果结果集最后的元素是"",一个一个地删除它们
			while (resultSize > 0 && matchList.get(resultSize - 1).equals(""))
			resultSize--;
		String[] result = new String[resultSize];
		return matchList.subList(0, resultSize).toArray(result);
	}

代码中注释转自https://www.cnblogs.com/xzhang/p/3995464.html

    正则表达式中“.”表示匹配任意一个字符。对于split函数而言,就是就是以任意字符为分隔符进行分割,那么“192.168.1.1”按照任意字符分割等价于“ccccccccccc”按照“c”进行分割,那么分割结果肯定都是空串。split函数中最后的while循环会将分割之后的字符串组,从后往前清理空字符串,所以“.”在不转义的情况下,分割字符串得到的结果为空。

    代码中,Matcher m = matcher(input)中,m记录下每个分隔符的位置。例如“abc;efg;hig”中,分隔符“;”的位置是3,7。m.start()可以获取到第一个分隔符的索引3,利用函数subSequence(int start, int end)进行分割,所以第一个子串传入参数[start = 0,end = 3],m.end()获取当前匹配到的分隔符之后的位置4;m.find()寻找下一个分隔符位置,m.start()为7,第二个字串[start = 4,end = 7];以此类推。

    对于字符串“192.168.1.1”按照“.”进行分割时,分隔符的位置为0,1,2,3,4,...,10,11,每个子串是[0,0],[1,1][2,2],...,[10,10],[11,11]。对于函数subSequence(int start, int end),end==start时返回空串。所以最后得到的结果也是空串。

    

    以上是一些简单分析,有不对的地方请大家多指教。

    下面附上相关的函数说明,便于大家理解:

m.start() //Returns the start index of the previous match.
m.end()   //Returns the offset after the last character matched.
m.find()  //Attempts to find the next subsequence of the input sequence that matches the pattern


<think>好的,我现在需要回答用户关于Java字符串分割函数split的使用方法和示例的问题。首先,我需要回忆一下split函数的基本用法和相关知识。 首先,split函数属于String类的方法,用于根据正则表达式将字符串分割成子字符串数组。用户可能想知道如何调用这个方法,以及需要注意的地方。例如,分隔符可以是普通字符,也可以是正则表达式中的特殊字符,这时候需要进行转义。 然后,我需要参考用户提供的引用内容。引用[1]、[2]、[3]都提到了split方法的基本用法,特别是引用[3]给出了语法结构:public String[] split(String regex)。引用[2]中的示例展示了如何用空格分割字符串,这可以作为基础示例。此外,引用[4]提到了String.join()方法,但用户的问题是关于split的,所以暂时不需要涉及这个。 接下来,我需要考虑用户可能需要的高级用法,比如限制分割次数。split方法有一个重载版本split(String regex, int limit),当limit为正数时,分割次数不超过该数;为负数时,尽可能多分割;为零时则分割所有但丢弃末尾的空字符串。例如,用逗分割字符串并限制次数,这在处理CSV数据时可能有用。 另外,用户可能遇到需要转义的特殊字符,比如.、竖线|等,这些在正则表达式中有特殊含义,必须转义。例如,用分割字符串时,需要写成split("\\.")。引用[3]中提到split的参数是正则表达式,所以这需要强调。 还需要注意,如果分割符在开头或结尾,或者连续出现,split默认会包含空字符串在结果数组中。但根据limit参数的不同,可能会有不同的处理方式。比如使用limit为0时,末尾的空字符串会被丢弃,这在引用[3]中可能有所涉及,但需要进一步确认。 然后,我需要组织这些信息,结构清晰。首先介绍split的基本语法,然后给出基础示例,接着讨论特殊字符的转义,再说明limit参数的作用,最后给出实际应用场景的示例,比如处理CSV或日志数据。同时,引用相关的引用来源,比如引用[2]中的示例,引用[3]中的语法说明,引用[1]中的整体介绍。 还需要检查是否有遗漏,比如正则表达式的使用可能导致性能问题,但用户的问题主要是使用方法和示例,可能不需要深入讨论性能。此外,是否有其他重载方法或相关函数需要提及?比如StringTokenizer类,但用户明确询问split函数,所以可以暂时忽略。 最后,生成相关问题,可能需要包括如何处理多个分隔符、性能优化、与其它方法的比较等。例如,用户可能想知道如何同时用多个分隔符分割字符串,这时候可以用正则表达式的或操作符,比如split(",|;")。 总结下来,回答的结构应该是:基本语法、简单示例、特殊字符处理、limit参数说明、实际应用示例,最后附相关问题。同时,确保每个引用在适当的地方标注,例如示例代码来自引用[2],语法说明来自引用[3]等。</think>### Java字符串split函数使用指南 #### 一、基本语法与功能 Java的`String.split()`函数通过正则表达式将字符串拆分为子字符串数组,语法为: ```java public String[] split(String regex) ``` 其中`regex`是作为分隔符的正则表达式,返回值为分割后的字符串数组[^3]。 --- #### 二、基础使用示例 1. **按空格分割** ```java String str = "Java string split test"; String[] parts = str.split(" "); // 输出结果:["Java", "string", "split", "test"][^2] ``` 2. **按逗分割** ```java String data = "apple,banana,orange"; String[] fruits = data.split(","); // 输出结果:["apple", "banana", "orange"] ``` --- #### 三、特殊字符处理 正则表达式中的特殊字符(如`.`、`|`、`*`)需转义: 1. **按分割** ```java String ip = "192.168.1.1"; String[] octets = ip.split("\\."); // 输出结果:["192", "168", "1", "1"] ``` 2. **按竖线分割** ```java String s = "A|B|C"; String[] letters = s.split("\\|"); // 输出结果:["A", "B", "C"] ``` --- #### 四、控制分割次数 使用`split(String regex, int limit)`控制分割次数: 1. **限制分割为2次** ```java String csv = "a,b,c,d"; String[] limited = csv.split(",", 2); // 输出结果:["a", "b,c,d"] ``` 2. **保留末尾空字符串** ```java String s = "one,,three,,"; String[] arr1 = s.split(",", -1); // ["one", "", "three", "", ""] String[] arr2 = s.split(","); // ["one", "", "three"] ``` --- #### 五、实际应用场景 1. **解析CSV数据** ```java String line = "id,name,age;101,Alice,25"; String[] rows = line.split(";"); for (String row : rows) { String[] fields = row.split(","); // 处理每个字段 } ``` 2. **提取日志关键字** ```java String log = "ERROR:2023-10-01 14:30:22|File not found"; String[] segments = log.split("\\|"); // segments[0] = "ERROR:2023-10-01 14:30:22" ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值