TheAlgorithms项目解析：计数排序算法详解-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00843/article/details/148602688

TheAlgorithms项目解析：计数排序算法详解

Algorithms-Explanation Popular algorithms explained in simple language with examples and links to their implementation in various programming languages and other required resources. 项目地址: https://gitcode.com/gh_mirrors/al/Algorithms-Explanation

什么是计数排序？

计数排序(Counting Sort)是一种非比较型整数排序算法，由Harold H. Seward于1954年提出。它通过统计元素出现次数来实现排序，特别适用于元素范围不大的整数序列。

算法核心思想

计数排序的基本原理是利用额外的数组空间来统计每个元素出现的次数，然后根据统计信息将元素放回正确的位置。这种算法突破了比较排序O(n log n)的时间复杂度下限，在特定条件下可以达到线性时间复杂度。

算法详细步骤

确定最大值：首先遍历整个数组，找出最大的元素值max
创建计数数组：初始化一个长度为max+1的计数数组count，所有元素初始化为0
统计元素频率：遍历原数组，统计每个元素出现的次数，存储在count数组中
计算累积和：将count数组转换为累积计数形式，表示每个元素在排序后数组中的最后位置
构建排序数组：反向遍历原数组，根据count数组中的位置信息将元素放入正确位置

时间复杂度分析

最佳情况：O(n + k)
最差情况：O(n + k)
平均情况：O(n + k)

其中n是元素数量，k是数据范围(max-min+1)。当k=O(n)时，算法达到线性时间复杂度。

空间复杂度

计数排序需要额外的空间来存储：

计数数组：O(k)
输出数组：O(n)

总空间复杂度为O(n + k)

算法特点与适用场景

优点

线性时间复杂度，远快于比较排序算法
稳定排序算法，保持相同元素的相对顺序
实现简单，逻辑清晰

缺点

仅适用于整数排序
当数据范围k很大时，空间消耗大
对负数需要额外处理

适用场景

元素为整数且范围不大
需要稳定排序
数据量大但取值范围小

代码示例解析

def counting_sort(arr):
    # 步骤1：找出数组中的最大值
    max_val = max(arr)
    
    # 步骤2：初始化计数数组
    count = [0] * (max_val + 1)
    
    # 步骤3：统计每个元素出现次数
    for num in arr:
        count[num] += 1
    
    # 步骤4：计算累积和
    for i in range(1, len(count)):
        count[i] += count[i-1]
    
    # 步骤5：构建排序数组
    output = [0] * len(arr)
    for num in reversed(arr):
        output[count[num]-1] = num
        count[num] -= 1
    
    return output