(参考资料:https://blog.youkuaiyun.com/daicooper/article/details/80788596)
Java 类库的 java.util 包中包含一个用于进行字符串词法分析的类 StringTokenizer ,目的是将对字符串进行分解的方法进行封装,以简化应用程序设计过程中的工作量。
StringTokenizer的构造方法
StringTokenizer 类提供3中形式的构造函数:
StringTokenizer(String str)
StringTokenizer(String sb,String delim) // delim为自定义分隔符号
StringTokenizer(String sb,String delim, boolean returnTokens)
在对一个字符串进行解析的时候,在字符串中必须包括一个用于解析的分隔符号。java 默认的分隔符为空格,制表符(‘\t’)、换行符(‘\n’)、回车符(‘\r’)。
如果在程序设计中想采用自定义的分隔符,可以通过在构造函数中指定 delim 项来设置用户分隔符。相应地,在 StringTokenizer 类中提供了相应的成员方法。
另外,如果 ReturnTokenizer 标志位 true, 则分隔符也被作为标记返回。每个分隔符作为长度为 1 的字符串返回。 如果标志为 false, 则跳过分隔符字符,且把它作为标记之间的分隔符。
StringTokenizer fenxi = new StringTokenizer("we are student");
String Tokenizer fenxi = new StringTokenizer("we ,are ; student",", ; ");
StringTokenizer类的常用方法
1、统计分隔符数量
public int countTokens()
该方法返回的是字符串中的当前单词的数量,为整数。
String str = new String("I lover java");
StringTokenizer st = new StringTokenizer(str);
int nTokens = st.countTokens(); //获取字符串中的当前单词的数量
2、匹配和寻找分隔符
通常,下面的两个组合方法局可以用来完成分隔符的寻找和匹配:
hasMoreElements() , nextElement()
和hasMoreTokens(), nextToken(), nextToken(String delim)
一般是用 hasMoreTokens 方法判断在字符串中是否还有已经定义的分隔符。如果有,则在除分隔符后,到下一个分隔符之前的内容进行一次循环;如果没有,则终止循环。
利用 StringTokenizer 类进行简单的词法分析。
实例:将语句中单词首字母大写
import java.util.*;
public class Test {
public static void main(String[] args) {
Scanner cin=new Scanner(System.in);
String s=cin.nextLine();
String []a=new String [100];
int t=0;
StringTokenizer st = new StringTokenizer(s," ");//提取空格,提取单个单词
while(st.hasMoreElements()) {
a[t]=(String) st.nextElement();//将提取的单词存入到数组里
t++;
}
for (int i=0;i<t;i++) {
a[i]=a[i].substring(0,1).toUpperCase().concat(a[i].substring(1));//将首字母变成大写
System.out.print(a[i]+" ");
}
cin.close();
}
}