剑指Offer:不修改数组找出重复的数字

本文介绍三种寻找数组中重复数字的方法,包括使用额外数组记录、直接比较及二分查找改进算法。通过对不同方法的分析,帮助读者理解算法设计的多样性和适用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在一个长度为n+1的数组里,所有的数字都在1~n的范围内,所以数组中至少有一个数字是重复的(因为长度为n+1,而1~n只有n个数字,也就是说就算每个数字不一样,都会空余一个位置,所以至少有一个重复的数字)请找出数组中任意一个重复的数字,但是不能修改输入的数组。例如,如果输入长度为8的数组{2,3,5,4,3,2,6,7},那么对应输出的数字应该是2或者3。

思路一:我们可以利用上篇博客的方式,创建一个新的数组。对这个新数组进行上篇博客的操作。将数组每个元素交换至其对应的角标下。以此类推,每次交换前判断对应角标下元素值。

#include <stdio.h>
#include <string.h>

int FindSameNum(int* tmp, int sz)
{
  if(tmp == NULL || sz == 0) {
    return -1;
  }

  int i = 0;
  for(; i < sz; ++i) {
    int cur = tmp[i];
    while(tmp[i] != i) {
      if(tmp[i] == tmp[cur]) {
        return tmp[i];
      }
      tmp[i] = tmp[cur];
      tmp[cur] = cur;
    }
  }
  return -1;
}

int main()
{
  int arr[] = {2,3,5,4,3,2,6,7};
  int sz = sizeof(arr)/sizeof(arr[0]);
  int tmp[sz];
  memmove(tmp, arr, sz);//利用memmove进行拷贝

  int ret = FindSameNum(tmp, sz);
  printf("ret expected 2 or 3, ret actual %d\n",ret);

  return 0;
}

这里写图片描述

思路二:同样是创建一片新的空间,并初始化为0。接着将原数组的元素数值插入至新数组角标为元素值的位置。插入前判断该位置是否为0,如果为0则可以插入,不是0,就是重复元素。

#include <stdio.h>

int FindSameNum(int* arr, int sz)
{
  if(arr == NULL || sz == 0) {
    return -1;
  }
  int i = 0;
  int tmp[sz] = {0};

  for(; i < sz; ++i) {
    int cur = arr[i];
    if(tmp[cur] == 0) {
      tmp[cur] = arr[i];
    } else {
      return arr[i];
    }
  }
  return -1;
}

int main()
{
  int arr[] = {2,3,5,4,3,2,6,7};
  int sz = sizeof(arr)/sizeof(arr[0]);

  int ret = FindSameNum(arr, sz);
  printf("ret expected 2 or 3, ret actual %d\n",ret);

  return 0;
}

这里写图片描述

思路三:由于题目要求,数组元素为1~n,我们将数组以数组元素值为分界分成两部分,第一部分1~m,第二部分为m+1~n,如果数组中元素值为1~m的元素出现了超过m次,那么重复的数字一定在1~m之间。以此类推。类似于二分查找。但是这个方法有一些局限性。我们后面再说。

#include <stdio.h>

int Count(int* arr, int sz, int start, int mid)
{
  if(arr == NULL || sz <= 0) {
    return -1;
  }

  int count = 0;
  sz -= 1;
  while(sz--) {
    if(arr[sz] >= start && arr[sz] <= mid) {
      count++;
    }
  }
  return count;
}

int FindSameNum(int* arr, int sz)
{
  if(arr == NULL || sz <= 0) {
    return -1;
  }

  int start = 1;
  int end = sz - 1;
  while(start <= end) {
    int mid = ((end - start)>>1) + start;
    int count = Count(arr, sz, start, mid);

    if(start == end) {
      if(count > 1) {
        return start;
      } else {
        break;
      }
    }

    if(count > (mid - start + 1)) {
      end = mid;
    } else {
      start = mid + 1;
    }
  }
  return -1;
}

int main()
{
  int arr[] = {2,3,1,4,4,5,6,7};
  int sz = sizeof(arr)/sizeof(arr[0]);

  int ret = FindSameNum(arr, sz);
  printf("ret expected 4, ret actual %d\n",ret);

  return 0;
}

这里写图片描述
局限性:比如:在这里数组中,元素为2,3,5,4,3,2,6,7。这个时候这个数组中的2是无法找出的,因为在1~2这个范围内,有1和2两个数字,而我们数组中这个范围内2恰好也出现了两次,所以这个时候是无法判断2的。所以我们这个算法不能确定每个数字各出现了一次还是某个数字出现了两次。


欢迎大家共同讨论,如有错误及时联系作者指出,并改正。谢谢大家!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值