剑指offer之数组中重复的数字

本文介绍了两种寻找数组中重复数字的算法,一种是利用数组下标特性,通过原地交换找到重复数字,另一种是运用抽屉原理和分治思想,统计区间内数字数量,逐步缩小范围直至找到重复数字。

题目描述:

在一个长度为n的数组里的所有数字都在0到n-1的范围内。 数组中某些数字是重复的,但不知道有几个数字是重复的。也不知道每个数字重复几次。请找出数组中任意一个重复的数字。 例如,如果输入长度为7的数组{2,3,1,0,2,5,3},那么对应的输出是第一个重复的数字2。

解题思路:

看到题目后第一反应就是使用Map集合进行存储,key为数组中出现的数字,value对应其出现的次数,但是这么处理的话空间复杂度较大。

题目中给出,长度为n的数组,其中的元素大小在0~n-1之间,我们可考虑将每个下标与数组元素进行对应,即出现下图。

在将每个元素放置在规定位置的过程中,如果发现本次循环没有进行交换的话则判断该元素的位置是否正确,不正确的话则代表该元素重复。

Java源码实现:

public class Solution {
    // Parameters:
    //    numbers:     an array of integers
    //    length:      the length of array numbers
    //    duplication: (Output) the duplicated number in the array number,length of duplication array is 1,so using duplication[0] = ? in implementation;
    //                  Here duplication like pointor in C/C++, duplication[0] equal *duplication in C/C++
    //    这里要特别注意~返回任意重复的一个,赋值duplication[0]
    // Return value:       true if the input is valid, and there are some duplications in the array number
    //                     otherwise false
    public boolean duplicate(int numbers[],int length,int [] duplication) {
        for (int i = 0; i < length;i++) {
            if (numbers[i] < 0 || numbers[i] >= length) return false;
            while(numbers[numbers[i]] != numbers[i]) {
                int num = numbers[numbers[i]];
                numbers[numbers[i]] = numbers[i];
                numbers[i] = num;
            }
            if (numbers[i] != i) {
               duplication[0] = numbers[i];
               return true;
            }
        }
        return false;
    }
}

扩展:

题目描述:

给定一个长度为 n+1的数组nums,数组中所有的数均在 1∼n 的范围内,其中 n≥1。

请找出数组中任意一个重复的数,但不能修改输入的数组。

样例

给定 nums = [2, 3, 5, 4, 3, 2, 6, 7]。

返回 2 或 3。

解题思路(转):

这道题目主要应用了抽屉原理和分治的思想。

抽屉原理:n+1 个苹果放在 n 个抽屉里,那么至少有一个抽屉中会放两个苹果。

用在这个题目中就是,一共有 n+1 个数,每个数的取值范围是1到n,所以至少会有一个数出现两次。

然后我们采用分治的思想,将每个数的取值的区间[1, n]划分成[1, n/2]和[n/2+1, n]两个子区间,然后分别统计两个区间中数的个数。
注意这里的区间是指 数的取值范围,而不是 数组下标

划分之后,左右两个区间里一定至少存在一个区间,区间中数的个数大于区间长度。
这个可以用反证法来说明:如果两个区间中数的个数都小于等于区间长度,那么整个区间中数的个数就小于等于n,和有n+1个数矛盾。

因此我们可以把问题划归到左右两个子区间中的一个,而且由于区间中数的个数大于区间长度,根据抽屉原理,在这个子区间中一定存在某个数出现了两次。

依次类推,每次我们可以把区间长度缩小一半,直到区间长度为1时,我们就找到了答案。

复杂度分析
时间复杂度:每次会将区间长度缩小一半,一共会缩小 O(logn)次。每次统计两个子区间中的数时需要遍历整个数组,时间复杂度是 O(n)。所以总时间复杂度是 O(nlogn)。
空间复杂度:代码中没有用到额外的数组,所以额外的空间复杂度是 O(1)。

Java源码实现:

public static boolean duplicate(int numbers[],int length,int [] duplication) {
        int l = 1; // 数组元素取值的最小值
        int r = length - 1; // 数组元素取值的最大值
        while(l < r) { // 注:这里不能写为l<=r,当二者相等的时候代表此时指向的元素取值是同一个,无法作为左右区间的划分标准,在执行 if (s > mid - l + 1) r = mid; else l = mid + 1;时是没有起任何作用的,会造成死循环。
            int s = 0;
            int mid = l + r >> 1; // 数组元素取值的中间值(数组元素取值范围为1~n)
            for (int number : numbers) { // 统计数组中小于mid的元素个数
                if (number >= l && number <= mid) {
                    s++;
                }
            }
            if (s > mid - l + 1) r = mid;
            else l = mid + 1;
        }
        duplication[0] = r;
        System.out.println(r);
        return true;
    }

 

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值