在字符串中的面试题中,有一类题是常考的,就是关于求字符频率问题的题。
字符串频率问题最好的办法或者说最通用的办法就是转化为数组问题。
for(int i=0; i<str.length(); i++) {
int value = str.charAt(i);
helper[value]++;
}
我们先来看几个例子
1. 判断一个字符串是否有重复的字符。
此题采用布尔型数组判断,因为整个计算机的ASCII码总数是128个基本码+128扩展码,所以只要一个字符串超过了256, 一定会出现重复字符。
默认boolean型helper数组的每个字符都为false, 一旦访问就变为true,
一旦访问的字符数组值已经为true,那就说明出现重复字符,返回false即可,
如果整个字符串访问结束,就返回true。
代码如下 public static boolean isUnique(String str) {
if(str.length()>256)
return false;
boolean[] helper = new boolean[256];
for(int i=0; i<str.length(); i++) {
int value = str.charAt(i);
if(!helper[value])
helper[value]=true;
else
return false;
}
return true;
}
2. 一个字符串中所有字符都出现了偶数次,只有一个元素出现了奇数次,找出那个字符。
此题采用布尔型数组判断,默认boolean型helper数组的每个字符都为false,
一旦访问就变为true,一旦访问了访问过的字符,字符值又变为false。
这样字符数组中没有出现过的字符和出现了偶数次的字符都为false,只有出现过奇数次的字符为true
代码如下 public static char findOdd(String str) {
if(str==null||str.length()==0)
return '^';
boolean[] helper = new boolean[256];
for(int i=0; i<str.length(); i++) {
int value = str.charAt(i);
if(helper[value]==true)
helper[value]=false;
else
helper[value]=true;
}
int i;
for(i=0; i<helper.length; i++) {
if(helper[i]==true)
break;
}
return (char)i;
}
3. 一个字符串中所有字符串都出现了奇数次,只有一个元素出现了偶数次,找出那个字符。
此题和第2题不同就在于出现偶数次和没有出现的字符数组对应值都为false, 所以不能用boolean型数组,应该用整型数组。
将字符数组转化为整型数组后就可以找出整形数组中不等于0的偶数,然后返回字符即可。
代码如下 public static char findEven(String str) {
if(str==null||str.length()==0)
return '^';
int[] helper = new int[256];
//transfer character to array problem
for(int i=0; i<str.length(); i++) {
int value = str.charAt(i);
helper[value]++;
}
int i;
for(i=0; i<helper.length; i++) {
if(helper[i]%2==0&&helper[i]!=0)
break;
}
return (char)i;
}
4. 判断两个字符串是否由完全相同的字符组成。
定义两个数组,如果长度不等直接返回false。
将字符数组转化为整型数组后一个数组遇见字符就“++”,另一个数组遇见字符就“--”。
只要出现负数就返回false。最后返回true。
代码如下 public static boolean isPermutation(String str1, String str2) {
if(str1.length()!=str2.length())
return false;
int[] helper = new int[256];
//transfer character to array problem
for (int i = 0; i < str1.length(); i++) {
int value = str1.charAt(i);
helper[value]++;
}
for (int i = 0; i < str2.length(); i++) {
int value = str2.charAt(i);
helper[value]--;
if (helper[value] < 0)
return false;
}
return true;
}
5. 判断一个字符串中出现频率第二高的字符。
将字符数组转化为整型数组,然后找整型数组中第二大的数
代码如下 public static char findSec(String str) {
if (str.length() == 0 || str == null)
return '^';
int[] helper = new int[256];
//transfer character to array problem
for (int i = 0; i < str.length(); i++) {
int value = str.charAt(i);
helper[value]++;
}
//find the second largest number in this array
int max = 0;
int secondMax = 1;
if (helper[max] < helper[secondMax]) {
max = 1;
secondMax = 0;
}
for (int i = 2; i < helper.length; i++) {
if (helper[i] > helper[max]) {
secondMax = max;
max = i;
} else if (helper[i] > helper[secondMax])
secondMax = i;
}
return (char) secondMax;
}
举一反三
1. 找出一个字符串中出现频率第k多的字符 要求时间复杂度为线性
2. 统计一个字符串中所有字符出现的频率。