题目及测试
package pid287;
/*寻找重复数
给定一个包含 n + 1 个整数的数组 nums,其数字都在 1 到 n 之间(包括 1 和 n),可知至少存在一个重复的整数。假设只有一个重复的整数,找出这个重复的数。
示例 1:
输入: [1,3,4,2,2]
输出: 2
示例 2:
输入: [3,1,3,4,2]
输出: 3
说明:
不能更改原数组(假设数组是只读的)。
只能使用额外的 O(1) 的空间。
时间复杂度小于 O(n2) 。
数组中只有一个重复的数字,但它可能不止重复出现一次。
}*/
public class main {
public static void main(String[] args) {
int[][] testTable = {{1,1,2},{1,1,2,2,5,6,7,7},{1,2,3,5},{1,1,1,1}};
for (int[] ito : testTable) {
test(ito);
}
}
private static void test(int[] ito) {
Solution solution = new Solution();
int rtn;
long begin = System.currentTimeMillis();
for (int i = 0; i < ito.length; i++) {
System.out.print(ito[i]+" ");
}//开始时打印数组
rtn = solution.findDuplicate(ito);//执行程序
long end = System.currentTimeMillis();
System.out.println("rtn=" + rtn);
/*for (int i = 0; i < rtn; i++) {
System.out.print(ito[i]+" ");
}//打印结果几数组
*/ System.out.println();
System.out.println("耗时:" + (end - begin) + "ms");
System.out.println("-------------------");
}
}
没想出来
使用参数进行修改的,可以使用排序。使用额外O(N)空间的,使用set进行contains判断
解法1(别人的)
二分法
我们定义 cnt[i] 表示 nums 数组中小于等于 i 的数有多少个,假设我们重复的数是 target,那么 [1,target−1]里的所有数满足 cnt[i]≤i,[target,n] 里的所有数满足 cnt[i]>i,具有单调性。
以示例 1 为例,我们列出每个数字的 cnt 值:
nums 1 2 2 3 4
cnt 1 3 4 5
示例中重复的整数是 2,我们可以看到 [1,1] 中的数满足 cnt[i]≤i,[2,4] 中的数满足 cnt[i]>i 。
如果知道 cnt[] 数组随数字 i 逐渐增大具有单调性(即 target 前 cnt[i]≤i,target 后 cnt[i]>i),那么我们就可以直接利用二分查找来找到重复的数。
但这个性质一定是正确的吗?考虑 nums 数组一共有 n+1 个位置,我们填入的数字都在 [1,n] 间,有且只有一个数重复放了两次以上。对于所有测试用例,考虑以下两种情况:
如果测试用例的数组中 target 出现了两次,其余的数各出现了一次,这个时候肯定满足上文提及的性质,因为小于 target 的数 i 满足 cnt[i]=i,大于等于 target 的数 j 满足 cnt[j]=j+1。
如果测试用例的数组中 target 出现了三次及以上,那么必然有一些数不在 nums 数组中了,这个时候相当于我们用 target 去替换了这些数,我们考虑替换的时候对 cnt[] 数组的影响。如果替换的数 i 小于 target ,那么 [i,target−1] 的 cnt 值均减一,其他不变,满足条件。如果替换的数 j 大于等于 target,那么 [target,j−1] 的 cnt 值均加一,其他不变,亦满足条件。
因此我们生成的数组一定具有上述性质的。
按题目表达,设数组长度为n,则数组中元素∈[1,n−1],且只有一个重复元素。一个直观的想法,设一个数字k∈[1,n−1],统计数组中小于等于k的数字的个数count:
若count<=k,说明重复数字一定在(k,n−1]的范围内。
若count>k,说明重复数字一定在[0,k]的范围内。
利用这个性质,我们使用二分查找逐渐缩小重复数字所在的范围。
初试化左右 数字 边界left=1,right=n−1
循环条件left<right:
mid=(left+right)/2
按照性质,统计数组中小于等于mid的元素个数count
若 count<=mid,说明重复数字一定在(mid,right]的范围内。令left=mid+1
若count>mid,说明重复数字一定在[left,mid]的范围内。令right=mid。
返回left
class Solution:
def findDuplicate(self, nums: List[int]) -> int:
left = 1
right = len(nums) - 1
while(left<right):
mid=(left+right)//2
count=0
for num in nums:
if(num<=mid):
count+=1
if(count<=mid):
left=mid+1
else:
right=mid
return left
解法2(别人的)
快慢指针
使用环形链表II的方法解题(142.环形链表II),使用 142 题的思想来解决此题的关键是要理解如何将输入的数组看作为链表。
首先明确前提,整数的数组 nums 中的数字范围是 [1,n]。考虑一下两种情况:
如果数组中没有重复的数,以数组 [1,3,4,2]为例,我们将数组下标 n 和数 nums[n] 建立一个映射关系 f(n),
其映射关系 n->f(n)为:
0->1
1->3
2->4
3->2
我们从下标为 0 出发,根据 f(n) 计算出一个值,以这个值为新的下标,再用这个函数计算,以此类推,直到下标超界。这样可以产生一个类似链表一样的序列。
0->1->3->2->4->null
如果数组中有重复的数,以数组 [1,3,4,2,2] 为例,我们将数组下标 n 和数 nums[n] 建立一个映射关系 f(n),
其映射关系 n->f(n) 为:
0->1
1->3
2->4
3->2
4->2
同样的,我们从下标为 0 出发,根据 f(n) 计算出一个值,以这个值为新的下标,再用这个函数计算,以此类推产生一个类似链表一样的序列。
0->1->3->2->4->2->4->2->……
这里 2->4 是一个循环
从理论上讲,数组中如果有重复的数,那么就会产生多对一的映射,这样,形成的链表就一定会有环路了,
综上
1.数组中有一个重复的整数 <==> 链表中存在环
2.找到数组中的重复整数 <==> 找到链表的环入口
至此,问题转换为 142 题。那么针对此题,快、慢指针该如何走呢。根据上述数组转链表的映射关系,可推出
142 题中慢指针走一步 slow = slow.next ==> 本题 slow = nums[slow]
142 题中快指针走两步 fast = fast.next.next ==> 本题 fast = nums[nums[fast]]
分为两步:
找到环
找到环的入口(即重复元素)
找环:
定义快慢指针slow=0,fast=0
进入循环:
slow每次走一步,即slow=nums[slow]
fast每次走两步,即fast=nums[nums[fast]]
当slow= =fast时,退出循环。
当快慢指针相遇时,一定在环内。此时假设slow走了k步,则fast走了2k步。设环的周长为c,则k%c= =0。
找环的入口:
定义新的指针find=0
进入循环:
find每次走一步,即find=nums[find]
slow每次走一步,即slow=nums[slow]
当两指针相遇时,即find==slow,返回find
为何相遇时,找到的就是入口:
假设起点到环的入口(重复元素),需要m步。此时slow走了n+m步,其中n是环的周长c的整数倍,所以相当于slow走了m步到达入口,再走了n步。所以相遇时一定是环的入口。
class Solution:
def findDuplicate(self, nums: List[int]) -> int:
slow=0
fast=0
while(1):
slow=nums[slow]
fast=nums[nums[fast]]
if(slow==fast):
break
find=0
while(1):
find=nums[find]
slow=nums[slow]
if(find==slow):
return find
解法3(别人的)
二进制
这个方法我们来将所有数二进制展开按位考虑如何找出重复的数,如果我们能确定重复数每一位是 1 还是 0 就可以按位还原出重复的数是什么。
考虑到第 i 位,我们记 nums 数组中二进制展开后第 i 位为 1 的数有 x 个,数字 [1,n] 这 n 个数二进制展开后第 i 位为 1 的数有 y 个,那么重复的数第 i 位为 1 当且仅当 x>y。
仍然以示例 1 为例,如下的表格列出了每个数字二进制下每一位是 1 还是 0 以及对应位的 x 和 y 是多少:
1 3 4 2 2 x y
第 0 位 1 1 0 0 0 2 2
第 1 位 0 1 0 1 1 3 2
第 2 位 0 0 1 0 0 1 1
那么按之前说的我们发现只有第 1 位 x>y ,所以按位还原后 target=(010)2=(2)10,符合答案。
正确性的证明其实和方法一类似,我们可以按方法一的方法,考虑不同示例数组中第 i 位 1 的个数 x 的变化:
如果测试用例的数组中 target 出现了两次,其余的数各出现了一次,且 target 的第 i 位为 1,那么 nums 数组中第 i 位 1 的个数 x 恰好比 y 大一。如果target 的第 i 位为 0,那么两者相等。
如果测试用例的数组中 target 出现了三次及以上,那么必然有一些数不在 nums 数组中了,这个时候相当于我们用 target 去替换了这些数,我们考虑替换的时候对 x 的影响:
如果被替换的数第 i 位为 1,且 target 第 i 位为 1:x 不变,满足 x>y。
如果被替换的数第 i 位为 0,且 target 第 i 位为 1:x 加一,满足 x>y。
如果被替换的数第 i 位为 1,且 target 第 i 位为 0:x 减一,满足 x≤y。
如果被替换的数第 i 位为 0,且 target 第 i 位为 0:x 不变,满足 x≤y。
也就是说如果 target 第 i 位为 1,那么每次替换后只会使 x 不变或增大,如果为 0,只会使 x 不变或减小,始终满足 x>y 时 target 第 i 位为 1,否则为 0,因此我们只要按位还原这个重复的数即可。
class Solution {
public int findDuplicate(int[] nums) {
int n = nums.length, ans = 0;
int bit_max = 31;
while (((n - 1) >> bit_max) == 0) {
bit_max -= 1;
}
for (int bit = 0; bit <= bit_max; ++bit) {
int x = 0, y = 0;
for (int i = 0; i < n; ++i) {
if ((nums[i] & (1 << bit)) != 0) {
x += 1;
}
if (i >= 1 && ((i & (1 << bit)) != 0)) {
y += 1;
}
}
if (x > y) {
ans |= 1 << bit;
}
}
return ans;
}
}