题目描述:
在一个长度为n的数组里的所有数字都在0到n-1的范围内。 数组中某些数字是重复的,但不知道有几个数字是重复的。也不知道每个数字重复几次。请找出数组中任意一个重复的数字。 例如,如果输入长度为7的数组{2,3,1,0,2,5,3},那么对应的输出是第一个重复的数字2。
解题思路:
看到题目后第一反应就是使用Map集合进行存储,key为数组中出现的数字,value对应其出现的次数,但是这么处理的话空间复杂度较大。
题目中给出,长度为n的数组,其中的元素大小在0~n-1之间,我们可考虑将每个下标与数组元素进行对应,即出现下图。

在将每个元素放置在规定位置的过程中,如果发现本次循环没有进行交换的话则判断该元素的位置是否正确,不正确的话则代表该元素重复。

Java源码实现:
public class Solution {
// Parameters:
// numbers: an array of integers
// length: the length of array numbers
// duplication: (Output) the duplicated number in the array number,length of duplication array is 1,so using duplication[0] = ? in implementation;
// Here duplication like pointor in C/C++, duplication[0] equal *duplication in C/C++
// 这里要特别注意~返回任意重复的一个,赋值duplication[0]
// Return value: true if the input is valid, and there are some duplications in the array number
// otherwise false
public boolean duplicate(int numbers[],int length,int [] duplication) {
for (int i = 0; i < length;i++) {
if (numbers[i] < 0 || numbers[i] >= length) return false;
while(numbers[numbers[i]] != numbers[i]) {
int num = numbers[numbers[i]];
numbers[numbers[i]] = numbers[i];
numbers[i] = num;
}
if (numbers[i] != i) {
duplication[0] = numbers[i];
return true;
}
}
return false;
}
}
扩展:
题目描述:
给定一个长度为 n+1的数组nums,数组中所有的数均在 1∼n 的范围内,其中 n≥1。
请找出数组中任意一个重复的数,但不能修改输入的数组。
样例
给定 nums = [2, 3, 5, 4, 3, 2, 6, 7]。
返回 2 或 3。
解题思路(转):
这道题目主要应用了抽屉原理和分治的思想。
抽屉原理:n+1 个苹果放在 n 个抽屉里,那么至少有一个抽屉中会放两个苹果。
用在这个题目中就是,一共有 n+1 个数,每个数的取值范围是1到n,所以至少会有一个数出现两次。
然后我们采用分治的思想,将每个数的取值的区间[1, n]划分成[1, n/2]和[n/2+1, n]两个子区间,然后分别统计两个区间中数的个数。
注意这里的区间是指 数的取值范围,而不是 数组下标。
划分之后,左右两个区间里一定至少存在一个区间,区间中数的个数大于区间长度。
这个可以用反证法来说明:如果两个区间中数的个数都小于等于区间长度,那么整个区间中数的个数就小于等于n,和有n+1个数矛盾。
因此我们可以把问题划归到左右两个子区间中的一个,而且由于区间中数的个数大于区间长度,根据抽屉原理,在这个子区间中一定存在某个数出现了两次。
依次类推,每次我们可以把区间长度缩小一半,直到区间长度为1时,我们就找到了答案。
复杂度分析
时间复杂度:每次会将区间长度缩小一半,一共会缩小 O(logn)次。每次统计两个子区间中的数时需要遍历整个数组,时间复杂度是 O(n)。所以总时间复杂度是 O(nlogn)。
空间复杂度:代码中没有用到额外的数组,所以额外的空间复杂度是 O(1)。
Java源码实现:
public static boolean duplicate(int numbers[],int length,int [] duplication) {
int l = 1; // 数组元素取值的最小值
int r = length - 1; // 数组元素取值的最大值
while(l < r) { // 注:这里不能写为l<=r,当二者相等的时候代表此时指向的元素取值是同一个,无法作为左右区间的划分标准,在执行 if (s > mid - l + 1) r = mid; else l = mid + 1;时是没有起任何作用的,会造成死循环。
int s = 0;
int mid = l + r >> 1; // 数组元素取值的中间值(数组元素取值范围为1~n)
for (int number : numbers) { // 统计数组中小于mid的元素个数
if (number >= l && number <= mid) {
s++;
}
}
if (s > mid - l + 1) r = mid;
else l = mid + 1;
}
duplication[0] = r;
System.out.println(r);
return true;
}
本文介绍了两种寻找数组中重复数字的算法,一种是利用数组下标特性,通过原地交换找到重复数字,另一种是运用抽屉原理和分治思想,统计区间内数字数量,逐步缩小范围直至找到重复数字。
540

被折叠的 条评论
为什么被折叠?



