Java字符串分割

最新推荐文章于 2024-07-01 19:26:31 发布

原创最新推荐文章于 2024-07-01 19:26:31 发布 · 903 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#split #StringTokenizer

Java开发专栏收录该内容

39 篇文章

订阅专栏

本文介绍了Java中使用split方法和StringTokenizer类进行字符串分割的方法及注意事项，对比了它们的性能，并展示了如何处理不同的分隔符。

一、split()方法

public String[] split(String regex)  
public String[] split(String regex,int limit)

参数说明：

regex：用于划分的正则表达式

limit：参数控制模式应用的次数，影响所得数组的长度。这个值可正可负可为零。limit为正数，表示返回的数组中元素的个数。

示例：

package com.learns.string;

import java.util.StringTokenizer;

public class test3 {

	public static void main(String[] args) {
		
		String t2 = "a:b:c:d:e:f";
		String[] split3 = t2.split(":",3);
		for(String s:split3)
		{
			System.out.println(s);
		}
	}
}

结果：

a
b
c:d:e:f

常用分隔符注意事项：
1、"|"、"*"、"+" 、"."都必须加上转译字符，即前面加上"\\"。
2、还有一个更特殊的，如果分隔符是"\"，那就必须写成"\\\\"。
3、如果一个字符串中有多个分隔符，可以用"|"作为连接字符。如: String str = "我#爱-你"，则可以写成str.split("#|-")

二、StringTokenizer

StringTokenizer是一个用来分割String的应用类。这个类是出于兼容性的原因而被保留的遗留类，所以并不建议使用它，建议使用String类中的split()方法进行字符串切割

1、构造函数

StringTokenizer(String str)：构造一个用来解析str的StringTokenizer对象。java默认的分隔符是“空格”、“制表符(‘\t’)”、“换行符(‘\n’)”、“回车符(‘\r’)”。
StringTokenizer(String str, String delim)：构造一个用来解析str的StringTokenizer对象，并提供一个指定的分隔符。
StringTokenizer(String str, String delim, boolean returnDelims)：构造一个用来解析str的StringTokenizer对象，并提供一个指定的分隔符，同时，指定是否返回分隔符。

参数说明：

str：要分割的String

delim：分割字符集合

returnDelims：表示分割符号是否作为标记返回。

2、常用方法

int countTokens()：返回nextToken方法被调用的次数。如果采用构造函数1和2，返回的就是分隔符数量。
boolean hasMoreTokens() ：返回是否还有分隔符。
boolean hasMoreElements() ：结果同2。
String nextToken()：返回从当前位置到下一个分隔符的字符串。
Object nextElement() ：结果同4。
String nextToken(String delim)：与4类似，以指定的分隔符返回结果。

示例：

package com.learns.string;

import java.util.StringTokenizer;

public class StringTokenizerTest {
	public static void main(String[] args) {
		String s = new String("The Java platform is the ideal platform for network computing");
		StringTokenizer st = new StringTokenizer(s," ",false);
		System.out.println( "Token Total: " + st.countTokens() );
		while( st.hasMoreElements() )
		{
			Object str = st.nextElement();
			System.out.println(str);
		}
	}
}

结果：

Token Total: 10
The
Java
platform
is
the
ideal
platform
for
network
computing

三、区别

性能比较：

package com.learns.string;

import java.util.StringTokenizer;
import java.util.Vector;

public class test {

	public static void main(String[] args) {
		String str = "abc";
		StringBuffer buffer = new StringBuffer();
		
		for(int i=0;i<1_000_000;i++)
		{
			buffer.append(str).append(" ");
		}
		
		str = buffer.toString();
		
		// StringTokenizer
		long curTime = System.currentTimeMillis();
		StringTokenizer token = new StringTokenizer(str," ");
		String[] array2 = new String[token.countTokens()];
		int i=0;
		while(token.hasMoreTokens())
		{
			array2[i++] = token.nextToken();
		}
		System.out.println("java.util.StringTokener:"+(System.currentTimeMillis()-curTime));
		
		// split方法
		curTime = System.currentTimeMillis();
		String[] array = str.split(" ");
		System.out.println("String.split:" + (System.currentTimeMillis()-curTime));
		
		// indexOf方法
		curTime = System.currentTimeMillis();
		Vector<String> vector = new Vector<String>();
		int index = 0;
		int offset = 0;
		while((index = str.indexOf(" ",index+1))!=-1)
		{
			vector.addElement(str.substring(offset,index));
			offset = index+1;
		}
		String[] array3 = vector.toArray(new String[0]);
		System.out.println("Vector & indexof:"+(System.currentTimeMillis() - curTime));
	}
}

结果：

java.util.StringTokener:550
String.split:1052
Vector & indexof:159

解释：StringTokenizer性能高于split方法，indexof性能最高

区别1：

package com.learns.string;

import java.util.StringTokenizer;

public class test3 {

	public static void main(String[] args) {
		String sample1 = "ben       ben";
		String[] split1 = sample1.split(" ");
		StringTokenizer tokens = new StringTokenizer(sample1," ");
		System.out.println(split1.length + " " + tokens.countTokens());
	}
}

结果：

8 2

解释：如果用split进行分离的话，他会将空格也作为一个字符串存入数组，而StringTokenizer不会

区别2：

package com.learns.string;

import java.util.StringTokenizer;

public class test3 {

	public static void main(String[] args) {	
		String t1 = "ben, ,,  ,,,ben";
		String[] split2 = t1.split(",");
		StringTokenizer tokens = new StringTokenizer(t1,",");
		System.out.println(split2.length + " " + tokens.countTokens());
	}
}

结果：