计数排序(counting sort)

本文深入解析计数排序算法,一种适用于特定数据集的稳定线性时间排序方法。文章阐述了计数排序的基本原理,包括使用额外数组进行元素计数、累加计数以及反向填充目标数组的过程。同时,讨论了计数排序的运行时间特性,以及其在数据范围受限场景下的高效应用。

计数排序(Counting sort)是一种稳定的线性时间排序算法。计数排序使用一个额外的数组 C ,其中第i个元素是待排序数组A中值等于 i的元素的个数。然后根据数组 C 来将 A中的元素排到正确的位置。

计数排序特征

当输入的元素是n个 0 到k 之间的整数时,它的运行时间是 Θ \Theta Θ (n+k)。计数排序不是比较排序,排序的速度快于任何比较排序算法。

由于用来计数的数组 C 的长度取决于待排序数组中数据的范围(等于待排序数组的最大值与最小值的差加上1),这使得计数排序对于数据范围很大的数组,需要大量时间和内存。例如:计数排序是用来排序0到100之间的数字的最好的算法,但是它不适合按字母顺序排序人名。但是,计数排序可以用在基数排序算法中,能够更有效的排序数据范围很大的数组。

通俗地理解,例如有10个年龄不同的人,统计出有8个人的年龄比A小,那A的年龄就排在第9位,用这个方法可以得到其他每个人的位置,也就排好了序。当然,年龄有重复时需要特殊处理(保证稳定性),这就是为什么最后要反向填充目标数组,以及将每个数字的统计减去1。算法的步骤如下:

  1. 找出待排序的数组中最大和最小的元素
  2. 统计数组中每个值为 i的元素出现的次数,存入数组 C 的第i项
  3. 对所有的计数累加(从C 中的第一个元素开始,每一项和前一项相加)
  4. 反向填充目标数组:将每个元素 i放在新数组的第 C[i]项,每放一个元素就将 C[i]}减去1

#算法实现

#include <iostream>

using namespace std;

int main()
{
    int num = 0;
    
    cout << "how many nums you want sort?" << endl;
    cin >> num;
    if (num <= 0)
    {
        return 0;
    }
    
    int i = 0;
    int a[num]={};//array wait to sort
    int a_sorted[num]={0};//array sorted
    cout << "enter number to sort one by one, end with enter" << endl;
    
    //get array to sort
    while (i<num)
    {
        cin >> a[i];
        i++;
    }
    
    //get min and max in array
    int min = a[0];
    int max = a[0];
    for (int i= 1;i < num;i++)
    {
        if (min > a[i])
        {
            min = a[i];
        }
        if (max < a[i])
        {
            max = a[i];
        }
    }
    
    //count number of a[i] appear and save to c[]
    int c_num = max-min+1;
    int c[c_num] = {0};
    for(int i = 0;i < num;i++)
    {
        c[a[i]-min]++;
    }
    
    //accumulate c[i]
    for(int i = 1;i < c_num;i++)
    {
        c[i] += c[i-1];
    }
    
    //fill sorted array reversely
    for(int i = num;i > 0;i--)
    {
        a_sorted[c[a[i-1]-min]-1] += a[i-1];
        --c[a[i-1]-min];
    }
    //output
    
    for(int i = 0;i < num;i++)
    {
        cout<<a_sorted[i]<< ", ";
    }
    return 0;
}

Reference
[1].https://zh.wikipedia.org/wiki/计数排序
[2].https://www.geeksforgeeks.org/counting-sort/

### Python 计数排序Counting Sort)算法实现 计数排序是一种非比较型整数排序算法,适用于数据范围较小的整数排序。该算法通过统计每个值出现的次数来进行排序。 #### 计数排序的核心思想 对于给定的一个数组 `arr` ,找到最大值 `max_val` 并创建一个长度为 `max_val + 1` 的辅助数组 `count` 。这个辅助数组用来记录原数组中各个数值出现的频次。最后再根据频次重构有序的新列表[^1]。 下面是具体的Python代码实现: ```python def counting_sort(arr): if not arr: # 处理空数组的情况 return [] max_val = max(arr) # 获取数组中的最大值 min_val = min(arr) # 获取最小值以便处理负数 offset = -min_val # 偏移量用于支持负数 m = max_val + offset + 1 # 考虑偏移后的大小 count = [0] * m # 初始化频率表 for a in arr: count[a + offset] += 1 # 统计各元素的数量 result = [] # 构建结果集 for i in range(len(count)): while count[i] > 0: # 将相同数量的i加入result result.append(i - offset) count[i] -= 1 return result # 返回已排序的结果 ``` 此版本不仅能够处理正整数还可以处理包含负数的数据集合[^2]。 为了验证上述函数的有效性,可以使用如下测试案例: ```python # 测试用例 test_cases = [ ([1,4,1,2,7,5,2], [1,1,2,2,4,5,7]), ([3,-1,2,-1,0], [-1,-1,0,2,3]) ] for case in test_cases: print(f"原始数组:{case[0]}") print(f"排序结果:{counting_sort(case[0])}") print(f"期望结果:{case[1]}\n") ``` 以上实现了对含有正整数以及含负数两种情况下计数排序的功能展示,并且保持了算法的时间复杂度为线性的特性即O(n)[^4]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值