浅谈关于字符串中求字符频率问题

本文讨论了字符串处理中常见的字符频率问题,包括如何判断字符串是否有重复字符、找出出现奇数次或偶数次的字符,以及如何判断两个字符串是否由相同字符组成等。通过转换为数组问题,使用布尔型或整型数组进行有效解决。

在字符串中的面试题中,有一类题是常考的,就是关于求字符频率问题的题。

字符串频率问题最好的办法或者说最通用的办法就是转化为数组问题。

		for(int i=0; i<str.length(); i++) {
			int value = str.charAt(i);
			helper[value]++;
		}

我们先来看几个例子

1. 判断一个字符串是否有重复的字符。

此题采用布尔型数组判断,因为整个计算机的ASCII码总数是128个基本码+128扩展码,所以只要一个字符串超过了256, 一定会出现重复字符。

默认boolean型helper数组的每个字符都为false, 一旦访问就变为true,

一旦访问的字符数组值已经为true,那就说明出现重复字符,返回false即可,

如果整个字符串访问结束,就返回true。

代码如下

	public static boolean isUnique(String str) {
		if(str.length()>256)
			return false;

		boolean[] helper = new boolean[256];
		
		for(int i=0; i<str.length(); i++) {
			int value = str.charAt(i);
			if(!helper[value])
				helper[value]=true;
			else
				return false;
		}
		return true;
	}


2. 一个字符串中所有字符都出现了偶数次,只有一个元素出现了奇数次,找出那个字符。

此题采用布尔型数组判断,默认boolean型helper数组的每个字符都为false, 

一旦访问就变为true,一旦访问了访问过的字符,字符值又变为false。

这样字符数组中没有出现过的字符和出现了偶数次的字符都为false,只有出现过奇数次的字符为true

代码如下

	public static char findOdd(String str) {
		if(str==null||str.length()==0)
			return '^';
		
		boolean[] helper = new boolean[256];
		
		for(int i=0; i<str.length(); i++) {
			int value = str.charAt(i);
			if(helper[value]==true)
				helper[value]=false;
			else
				helper[value]=true;
		}
		
		int i;
		for(i=0; i<helper.length; i++) {
			if(helper[i]==true)
				break;		
		}
		return (char)i;
	}


3. 一个字符串中所有字符串都出现了奇数次,只有一个元素出现了偶数次,找出那个字符。

此题和第2题不同就在于出现偶数次没有出现的字符数组对应值都为false, 所以不能用boolean型数组,应该用整型数组。

将字符数组转化为整型数组后就可以找出整形数组中不等于0的偶数,然后返回字符即可。

代码如下

	public static char findEven(String str) {
		if(str==null||str.length()==0)
			return '^';
	
		int[] helper = new int[256];
		
		//transfer character to array problem
		for(int i=0; i<str.length(); i++) {
			int value = str.charAt(i);
			helper[value]++;
		}
		
		int i;
		for(i=0; i<helper.length; i++) {
			if(helper[i]%2==0&&helper[i]!=0)
				break;
		}
		return (char)i;
	}

4. 判断两个字符串是否由完全相同的字符组成。

定义两个数组,如果长度不等直接返回false。

将字符数组转化为整型数组后一个数组遇见字符就“++”,另一个数组遇见字符就“--”。

只要出现负数就返回false。最后返回true。

代码如下

	public static boolean isPermutation(String str1, String str2) {
		if(str1.length()!=str2.length())
			return false;
		
		int[] helper = new int[256];

		//transfer character to array problem
		for (int i = 0; i < str1.length(); i++) {
			int value = str1.charAt(i);
			helper[value]++;
		}
		for (int i = 0; i < str2.length(); i++) {
			int value = str2.charAt(i);
			helper[value]--;
			if (helper[value] < 0)
				return false;
		}
		return true;
	}

5. 判断一个字符串中出现频率第二高的字符。

将字符数组转化为整型数组,然后找整型数组中第二大的数

代码如下

	public static char findSec(String str) {
		if (str.length() == 0 || str == null)
			return '^';

		int[] helper = new int[256];

		//transfer character to array problem
		for (int i = 0; i < str.length(); i++) {
			int value = str.charAt(i);
			helper[value]++;
		}

		//find the second largest number in this array
		int max = 0;
		int secondMax = 1;
		if (helper[max] < helper[secondMax]) {
			max = 1;
			secondMax = 0;
		}
		for (int i = 2; i < helper.length; i++) {
			if (helper[i] > helper[max]) {
				secondMax = max;
				max = i;
			} else if (helper[i] > helper[secondMax])
				secondMax = i;
		}
		return (char) secondMax;
	}

举一反三

1. 找出一个字符串中出现频率第k多的字符 要求时间复杂度为线性

2. 统计一个字符串中所有字符出现的频率。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值