数组去重(c语言实现)

起因

在九度练习acm的时候,有道题我认为应该先进行数组去重操作,由于工作中我大部分都是用php写代码,php中数组去重只要一个array_diff()函数即可实现,但是到C语言中,我就没有现成的api函数可以让我调用了,因此我自己实现了一个算法,进行数组去重,但是这个算法有明显的缺陷,我会先把算法展示出来,然后解释算法的缺陷

数组去重代码

#include <stdio.h>
#include <stdlib.h>

#define false -1

int arraydiff(int *A, int max, int len);

int main()
{
	int a[100];
	int n, k, i, len, max;

	while(scanf("%d",&n) != EOF)
	{
		//接收客户端数据
		for(i = 0; i < n; i ++)
		{
			scanf("%d",&a[i]);
		}
		scanf("%d",&k);

		//找到a[i]的最大数
		max = a[0];
		for(i = 1; i < n; i ++)
		{
			if(max < a[i])
				max = a[i];
		}

		//数组去重加由小到大排序
		len = arraydiff(a, max, n);
		
		//输出第K大的数
		printf("%d\n",a[k - 1]);
	}

	return 0;
}

/**
 * Description:数组去重算法
 */
int arraydiff(int *A, int max, int len)
{
	int arrayflag[max + 1];
	int i, j;

	//初始化标志数组
	for(i = 0; i <= max; i ++)
	{
		arrayflag[i] = false;
	}

	//剔除算法
	for(i = 0; i < len; i ++)
	{
		arrayflag[A[i]] = A[i];
	}

	//取出有效数
	for(i = 0, j = 0; i <= max; i ++)
	{
		if(arrayflag[i] != false)
		{
			A[j ++] = arrayflag[i];
		}
	}
	return j;
}

缺陷

因为该算法需要重新申请数组空间,而数组空间的大小则是以去重数组中的最大数为标准,这样就会出现很极端的情况,我的数组int A[4] = {112000,11200,1,2},尽管需要去重的数组A大小为4,我却要重新申请112000大小的新的内存空间,这是极大的浪费

需求

希望大家能给我回帖,写出您认为比较好的数组去重算法,建议代码最好用C实现,凡是给我留言者,我必定回复
### C语言实现数组方法 #### 方法一:辅助数组法 通过创建一个辅助数组来存储已经的元素。对于每一个新读取的元素,将其与辅助数组中的已有元素逐一比较。如果没有发现复,则将此元素加入辅助数组。 这种方法的时间复杂度较高,在最坏的情况下为 \(O(n^2)\)[^1]。以下是基于该逻辑的一个简单实现: ```c #include <stdio.h> void removeDuplicates(int *arr, int size, int *result, int *resSize) { *resSize = 0; for (int i = 0; i < size; ++i) { bool isDuplicate = false; for (int j = 0; j < *resSize; ++j) { if (arr[i] == result[j]) { isDuplicate = true; break; } } if (!isDuplicate) { result[*resSize] = arr[i]; (*resSize)++; } } } int main() { int array[] = {1, 2, 3, 2, 4, 5, 1}; int size = sizeof(array)/sizeof(array[0]); int result[size]; int resSize; removeDuplicates(array, size, result, &resSize); printf("After removing duplicates:\n"); for (int i = 0; i < resSize; ++i) { printf("%d ", result[i]); } return 0; } ``` #### 方法二:排序加单次遍历 首先对数组进行排序,之后只需一次线性扫描即可除相邻的复项。这种策略的前提是对数组进行了预排序,因此整体时间复杂度主要取决于所使用的排序算法。通常采用快速排序或其他高效的排序技术,使得整个过程达到 \(O(n \log n)\)[^2] 的效率。 下面是一个例子展示如何结合冒泡排序完成这一目标: ```c #include<stdio.h> #define MAX_SIZE 100 // Bubble Sort Function void bubbleSort(int A[], int N){ int temp; for(int pass=1;pass<N-1;pass++) for(int i=0;i<N-pass;i++) if(A[i]>A[i+1]){ temp=A[i]; A[i]=A[i+1]; A[i+1]=temp; } } int eliminateDupesAndCount(int sortedArr[], int length){ int uniqueIndex = 0; for(int index=1;index<length;index++){ if(sortedArr[index]!=sortedArr[uniqueIndex]){ uniqueIndex++; sortedArr[uniqueIndex]=sortedArr[index]; } } return uniqueIndex + 1; } int main(){ int M,n,i,j,k,a[MAX_SIZE]; scanf("%d",&M); while(M--){ scanf("%d",&n); for(i=0;i<n;i++)scanf("%d",&a[i]); bubbleSort(a,n); k = eliminateDupesAndCount(a,n); for(i=0;i<k;i++)printf("%d ",a[i]); puts(""); } return 0; } ``` #### 方法三:哈希表(Set) 当需要更高效的方式时,可以考虑引入额外的空间开销——即构建一个散列表或集合(Set),用于记录哪些数值已经被访问过。这种方式能够显著降低查找是否存在的成本至常数级别\(O(1)\),从而使总体性能提升到接近线性的水平\(O(n)\)[^4]。 由于标准C库并不直接提供内置的支持结构像其他高级编程语言那样拥有专门的数据类型比如Python里的`set`,所以这里我们模拟了一个简易版本的功能演示如下所示: ```c #include <stdbool.h> #include <stdio.h> bool hashTable[10000]; // Assuming values are within this range. void initializeHashTable(bool table[]) { for (size_t i = 0; i < sizeof(hashTable)/sizeof(hashTable[0]); ++i) { table[i] = false; } } void removeDupsUsingHash(int inputArray[], int lenInput, int outputArray[]) { int posOutput = 0; initializeHashTable(hashTable); for (int idxInp = 0; idxInp < lenInput; ++idxInp) { if(!hashTable[inputArray[idxInp]]) { hashTable[inputArray[idxInp]] = true; outputArray[posOutput++] = inputArray[idxInp]; } } } int main(void) { int originalData[] = {97, 86, 97, 86, 45, 32, 45}; const int LENGTH_ORIGINAL_DATA = sizeof(originalData)/sizeof(*originalData); int deduplicatedData[LENGTH_ORIGINAL_DATA]; removeDupsUsingHash(originalData, LENGTH_ORIGINAL_DATA, deduplicatedData); for (int idxOut = 0; idxOut < LENGTH_ORIGINAL_DATA && hashTable[deduplicatedData[idxOut]]; ++idxOut) { printf("%d ", deduplicatedData[idxOut]); } return 0; } ```
评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

低调小一

您的鼓励是我创作最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值