计数排序
基本思想
计数排序是一个非基于比较的排序算法,又称为鸽巢原理,是对哈希直接定址法的变形应用,该算法于1954年由 Harold H. Seward 提出。它的排序思想是:首先统计相同元素的个数,然后将个数存储在用于计数的数组的相应下标位置内,最后根据统计的结果将序列再次回收到原来的序列之中。
排序过程
首先遍历待排序序列,在遍历的同时统计相同元素的出现次数,然后将统计的次数存储到用于计数的数组中,存储时按照元素在整个待排序序列范围的相对位置存储在相应的数组下标内,然后根据统计的结果将序列回收到原来的序列之中。
C语言代码实现
// 升序排序
void CountSort(int* a, int n)
{
int min = a[0], max = a[0];
for (int i = 0; i < n; ++i)
{
if (a[i] > max)
max = a[i];
if (a[i] < min)
min = a[i];
}
int range = max - min + 1;
int* counta = (int*)malloc(sizeof(int)*(max - min));
memset(counta, 0, sizeof(int)*range);
// 统计次数
for (int i = 0; i < n; ++i)
counta[a[i] - min]++;
// 排序
int j = 0;
for (int i = 0; i < range; ++i)
while (counta[i]--)
a[j++] = i + min;
}
时间复杂度
计数排序的优势在于在对一定范围内的整数排序时,它的复杂度为Ο(N+k)(其中k是整数的范围),快于任何比较排序算法。这是一种牺牲空间换取时间的做法,而且当O(k)>O(NlogN)的时候其效率反而不如基于比较的排序(基于比较的排序的时间复杂度在理论上的下限是O(NlogN),如归并排序,堆排序)。
计数排序在数据范围集中时,效率很高,但是适用范围及场景有限。
它的时间复杂度是它遍历整个原序列数组和用于计数的数组所用的时间,故其时间复杂度为O(MAX(N,范围))。
空间复杂度
它所消耗的空间是开辟的用于计数的数组的大小,所以它的空间复杂度为O(范围)。
稳定性
计数算法只能用于非负整数的元素集合的排序,使用场合有限,最后的排序根据每个数字的出现次数重新写回原数组中,所以认为它是稳定的。