快速在数组中查找重复和遗失的元素
问题
给定集合Z={x1,x2,...,xn}Z = \{ x_1, x_2, ..., x_n \}Z={x1,x2,...,xn}。集合内包含nnn个元素,每个元素都是数字。对于另一个集合AAA,它缺失了ZZZ中的一个元素,并重复了一个元素。
希望设计一个算法,找出重复和缺失的元素。空间复杂度O(1)O(1)O(1),时间复杂度O(n)O(n)O(n)。
分析
本题有两种解法,一个用到了数学公式求解,一个是异或运算求解。为描述方便,我们假设重复的元素为xix_ixi,缺失的元素为xjx_jxj。其中1≤i≤n,1≤j≤n1 \leq i \leq n, 1 \leq j \leq n1≤i≤n,1≤j≤n。
解法1
思路
把ZZZ中的元素求和,记为sumzsum_zsumz。把AAA中的元素求和,记为sumasum_asuma。把ZZZ中的元素平方求和,记为sumz2sum_z^2sumz2。把AAA中的元素平方求和,记为suma2sum_a^2suma2。
S1=sumz−suma=xj−xiS2=sumz2−suma2=xj2−xi2
S_1 = sum_z - sum_a = x_j - x_i \\
S_2 = sum_z^2 -sum_a^2 = x_j^2 - x_i^2\\
S1=sumz−suma=xj−xiS2=sumz2−suma2=xj2−xi2
我们有 S3=S2S1=xj+xiS_3 = \frac{S_2}{S_1} = x_j + x_iS3=S1S2=xj+xi。所以 xj=S3+S12x_j = \frac{S_3 + S_1}{2}xj=2S3+S1 , xi=S3−S12x_i = \frac{S_3 - S_1}{2}xi=2S3−S1。
代码
public class FindDuplicateAndMissingElements{
private int[] Z;
private int[] A;
private int missingElement = 0;
private int duplicateElement = 0;
public FindDuplicateAndMissingElements(int[] Z, int[] A){
this.Z = Z;
this.A = A;
}
private void findElements(){
int sumZ = 0, sumA = 0;
int sumZ2 = 0, sumA2 = 0;
for (int i = 0; i < Z.length; i++) {
sumZ += Z[i];
sumA += A[i];
sumZ2 += Z[i] * Z[i];
sumA2 += A[i] * A[i];
}
int s1 = sumZ - sumA;
int s2 = sumZ2 - sumA2;
int s3 = s2 / s1;
missingElement = (s1 + s2) / 2;
duplicateElement = (s2 - s1) / 2;
}
public int getMissingElement() {
return missingElement;
}
public int getDuplicateElement() {
return duplicateElement;
}
}
解法2
思路
把集合AAA中所有元素异或,得到xorAxor_AxorA。把集合ZZZ中所有元素异或,得到xorZxor_ZxorZ。那么记tmp=xorA⨁xorZ=xi⨁xjtmp = xor_A \bigoplus xor_Z = x_i \bigoplus x_jtmp=xorA⨁xorZ=xi⨁xj。
因为xix_ixi与xjx_jxj是两个不同的元素,它们异或结果一定不为零。那么转化为二进制的话,一定在某一位上为1。遍历集合ZZZ,把集合内所有在这一位上都为1的元素拿出来,组成新的集合C={xi1,xi2,...,xim}C = \{ x_{i1}, x_{i2}, ..., x_{im} \}C={xi1,xi2,...,xim}。对集合AAA做一样的操作,把所有在这一位上都为1的元素拿出来,组成新的集合D={xt1,xt2,...,xtm}D = \{ x_{t1}, x_{t2}, ... , x_{tm} \}D={xt1,xt2,...,xtm}。 把CCC的所有元素求得异或和,记为xorCxor_CxorC。 把DDD的所有元素求得异或和,记为xorDxor_DxorD。记x=xorC⨁xorDx = xor_C \bigoplus xor_Dx=xorC⨁xorD, y=tmp⨁xy = tmp \bigoplus xy=tmp⨁x。
遍历一遍集合AAA,假如xxx出现在集合AAA,那么xxx是重复的元素,yyy是缺失的元素。假如yyy出现在集合AAA,那么yyy是重复的元素,xxx是缺失的元素。
代码
public class FindDuplicateAndMissingElements{
private int[] Z;
private int[] A;
private int missingElement = 0;
private int duplicateElement = 0;
public FindDuplicateAndMissingElements(int[] Z, int[] A){
this.Z = Z;
this.A = A;
}
private void findElements(){
int xorZ = 0, xorA = 0;
for (int i = 0; i < Z.lenght; i++){
xorA = xorA ^ A[i];
xorZ = xorZ ^ Z[i];
}
int tmp = xorA ^ xorZ;
int mark = 1;
int i = 0;
while (true){
mark = mark << i;
if ((tmp) & mark != 0) {
break;
}
i++;
}
xorA = 0;
xorZ = 0;
for (int i = 0; i < Z.length; i++) {
if ((A[i] & mark) != 0) {
xorA = xorA ^ A[i];
}
if ((Z[i] & mark) != 0) {
xorZ = xorZ ^ Z[i];
}
}
int x = xorA ^ xorZ;
int y = tmp ^ x;
boolean flag = false;
for (int i = 0; i < Z.length; i++) {
if (A[i] == x) {
duplicateElement = x;
missingElement = y;
flag = true;
break;
}
}
if (flag == false) {
duplicateElement = y;
missingElement = x;
}
}
public int getMissingElement() {
return missingElement;
}
public int getDuplicateElement() {
return duplicateElement;
}
}