C语言实现基数排序（radix sort）：深入剖析计数排序延伸技术（附完整源码）

C语言实现基数排序详解

原创于 2025-10-30 09:24:51 发布 · 956 阅读

CC 4.0 BY-SA版权

第一章：C语言实现基数排序（radix sort）：深入剖析计数排序延伸技术

基数排序是一种非比较型整数排序算法，通过将整数按位数切割并从最低位到最高位依次使用稳定排序（如计数排序）进行排序，最终得到有序序列。该算法的时间复杂度为 O(d × (n + k))，其中 d 为最大数的位数，n 为元素个数，k 为基数（通常为10），在处理大规模整数数据时具有显著优势。

算法核心思想

基数排序依赖于“逐位排序”的策略，借助稳定排序算法保证相同位值的元素相对顺序不变。其关键步骤包括：

确定待排序数组中最大数的位数
从个位开始，对每一位执行稳定排序（常用计数排序）
依次处理十位、百位，直至最高位完成排序

C语言实现示例


#include <stdio.h>

// 获取最大值以确定最大位数
int getMax(int arr[], int n) {
    int max = arr[0];
    for (int i = 1; i < n; i++)
        if (arr[i] > max)
            max = arr[i];
    return max;
}

// 使用计数排序对特定数位进行排序
void countSort(int arr[], int n, int exp) {
    int output[n];
    int count[10] = {0};

    // 统计当前位上各数字出现次数
    for (int i = 0; i < n; i++)
        count[(arr[i] / exp) % 10]++;

    // 修改count数组，使其包含实际位置
    for (int i = 1; i < 10; i++)
        count[i] += count[i - 1];

    // 构建输出数组（逆序确保稳定性）
    for (int i = n - 1; i >= 0; i--) {
        output[count[(arr[i] / exp) % 10] - 1] = arr[i];
        count[(arr[i] / exp) % 10]--;
    }

    // 将排序结果复制回原数组
    for (int i = 0; i < n; i++)
        arr[i] = output[i];
}

// 基数排序主函数
void radixSort(int arr[], int n) {
    int max = getMax(arr, n);
    for (int exp = 1; max / exp > 0; exp *= 10)
        countSort(arr, n, exp);
}

性能对比分析

排序算法	时间复杂度（平均）	是否稳定	适用场景
快速排序	O(n log n)	否	通用高效排序
归并排序	O(n log n)	是	需要稳定性的场合
基数排序	O(d × (n + k))	是	整数、字符串等固定长度键排序

第二章：基数排序的核心原理与算法特性

2.1 基数排序的基本思想与位优先策略

基数排序是一种非比较型整数排序算法，通过按位划分数据并逐位排序，最终实现整体有序。其核心思想是将整数按位数切割成不同的数字，从最低位或最高位开始，依次对每一位进行稳定排序。

位优先策略的分类

基数排序通常采用两种位优先策略：

LSD（Least Significant Digit）：从最低位开始排序，适用于固定位数的整数。
MSD（Most Significant Digit）：从最高位开始排序，适合可变长键值，如字符串。

以LSD为例的实现逻辑

def radix_sort(arr):
    if not arr:
        return arr
    max_num = max(arr)
    exp = 1  # 当前处理的位数（个位、十位...）
    while max_num // exp > 0:
        counting_sort_by_digit(arr, exp)
        exp *= 10

上述代码中，exp 表示当前处理的位权（1表示个位，10表示十位），循环条件确保处理到最高位为止。每次调用计数排序对当前位进行稳定排序，逐步构建最终有序序列。

2.2 按位排序的数学基础与数据分布分析

按位排序（Bitonic Sort）依赖于分治策略与二进制比较网络，其数学基础源于布尔立方体上的单调路径性质。在长度为 $2^n$ 的序列中，通过构造位对称比较序列，可实现 $O(\log^2 n)$ 时间复杂度的并行排序。

数据分布特性

理想情况下，输入数据应均匀分布在二进制维度上，以减少比较阶段的冗余交换。若高位集中相同值，则低位比较主导排序行为。

核心代码实现


// bitonicSort 对给定数组按方向递归排序
func bitonicSort(arr []int, low, cnt, dir int) {
    if cnt > 1 {
        k := cnt / 2
        bitonicSort(arr, low, k, 1)        // 升序构造
        bitonicSort(arr, low+k, k, 0)      // 降序构造
        bitonicMerge(arr, low, cnt, dir)
    }
}

该递归函数将数组划分为两个子序列，分别构造升序和降序的比特onic序列，最终通过bitonicMerge按指定方向合并。参数dir控制排序方向（1为升序，0为降序），cnt为当前处理长度。

2.3 稳定性保障与计数排序的依赖关系

在非比较排序算法中，计数排序的正确性高度依赖于其稳定性。稳定性确保相同元素在输出数组中的相对位置与输入一致，这对多轮排序或键值关联场景至关重要。

稳定性的实现机制

计数排序通过累加频次数组并逆序遍历原数组来维持稳定性。关键步骤如下：

// 构建计数数组并累加前缀
for i := 0; i < len(arr); i++ {
    count[arr[i]-min]++
}
for i := 1; i < len(count); i++ {
    count[i] += count[i-1]
}

// 逆序填充结果数组以保持稳定
for i := len(arr) - 1; i >= 0; i-- {
    output[count[arr[i]-min]-1] = arr[i]
    count[arr[i]-min]--
}

上述代码中，逆序遍历保证了相同值的元素被放置在结果数组的靠后位置，从而维持输入顺序。

稳定性对排序链的影响

若计数排序不稳定，后续基于键排序的操作将产生错误结果
在基数排序中，每一轮计数排序必须稳定，否则整体排序失效
实际系统中，日志时间戳、订单编号等场景依赖此特性

2.4 时间复杂度与空间开销的理论推导

在算法设计中，时间复杂度和空间开销是衡量性能的核心指标。通过数学建模可精确推导其渐进行为。

大O表示法基础

大O（Big-O）用于描述算法最坏情况下的增长上界。例如，嵌套循环遍历n×n矩阵的时间复杂度为O(n²)。

典型算法分析示例

func sumArray(arr []int) int {
    sum := 0
    for i := 0; i < len(arr); i++ { // 循环执行n次
        sum += arr[i]
    }
    return sum
}

该函数执行n次加法操作，时间复杂度为O(n)，仅使用常量额外变量，空间复杂度为O(1)。

复杂度对比表

算法	时间复杂度	空间复杂度
线性搜索	O(n)	O(1)
归并排序	O(n log n)	O(n)
递归斐波那契	O(2^n)	O(n)

2.5 与其他线性排序算法的对比分析

时间复杂度与适用场景比较

线性排序算法如计数排序、桶排序和基数排序均在特定条件下突破 O(n log n) 的比较排序下界。它们依赖数据分布特性，适用于整数或可映射为整数的键值。

算法	时间复杂度	空间复杂度	稳定性
计数排序	O(n + k)	O(k)	稳定
桶排序	O(n + k)	O(n + k)	稳定（若桶内使用稳定排序）
基数排序	O(d × (n + k))	O(n + k)	稳定

核心差异与实现逻辑

计数排序通过统计每个元素出现次数重建有序序列，适合取值范围小的整数：


void countingSort(int arr[], int n, int k) {
    int count[k + 1] = {0};
    for (int i = 0; i < n; i++) count[arr[i]]++;
    for (int i = 1; i <= k; i++) count[i] += count[i - 1];
    int output[n];
    for (int i = n - 1; i >= 0; i--) output[--count[arr[i]]] = arr[i];
    for (int i = 0; i < n; i++) arr[i] = output[i];
}

该实现中，k 为最大值，两次前缀和处理确保稳定性和正确位置映射。相比之下，基数排序按位排序，支持更大范围整数；桶排序则利用区间划分，对均匀分布数据效果最佳。

第三章：C语言中关键函数的设计与实现

3.1 获取最大值以确定排序位数

在基数排序中，首先需要确定待排序数组中的最大值，以此计算其位数，从而决定排序的轮次。

最大值获取逻辑

通过一次遍历即可找到数组中的最大元素，时间复杂度为 O(n)。

int getMax(int arr[], int n) {
    int max = arr[0];
    for (int i = 1; i < n; i++) {
        if (arr[i] > max)
            max = arr[i];
    }
    return max;
}

上述 C 语言函数遍历数组 arr，初始假设第一个元素为最大值，逐个比较更新。返回的最大值用于后续计算位数（例如：max > 0 时循环除以10）。

位数计算与意义

最大值的位数决定了基数排序中按位处理的次数。例如，最大值为 987，则需进行 3 轮排序（个、十、百位）。

3.2 计数排序在基数排序中的适配实现

在基数排序中，计数排序作为稳定子排序算法被频繁调用，用于按每一位进行排序。由于基数排序需保持相同位值元素的相对顺序，计数排序的稳定性至关重要。

计数排序辅助函数实现

void countingSort(int arr[], int n, int exp) {
    int output[n];
    int count[10] = {0};

    // 统计当前位（个位、十位等）数字频次
    for (int i = 0; i < n; i++)
        count[(arr[i] / exp) % 10]++;

    // 修改count[i]表示该数字在output中的位置
    for (int i = 1; i < 10; i++)
        count[i] += count[i - 1];

    // 从后向前构建output数组以保证稳定性
    for (int i = n - 1; i >= 0; i--) {
        output[count[(arr[i] / exp) % 10] - 1] = arr[i];
        count[(arr[i] / exp) % 10]--;
    }

    for (int i = 0; i < n; i++)
        arr[i] = output[i];
}

参数 exp 表示当前处理的位权（1表示个位，10表示十位等），通过 (arr[i] / exp) % 10 提取对应位上的数字。

基数排序主流程

找出最大值以确定最大位数
对每一位调用计数排序，从低位到高位依次处理
每轮排序基于当前位，但保持整体相对顺序

3.3 基于位操作的数字拆分与重组逻辑

在底层数据处理中，位操作提供了高效拆分与重组整数的方法。通过移位和掩码技术，可将一个整数按比特段分解为多个逻辑字段。

拆分整数的位段

例如，将32位整数分为高16位与低16位：


uint32_t value = 0xABCD1234;
uint16_t high = (value >> 16) & 0xFFFF;  // 高16位
uint16_t low  = value & 0xFFFF;           // 低16位

右移16位提取高位，再通过与操作确保只保留低16位；低位直接掩码提取。

重组位段恢复原始值

使用左移与或操作合并：


uint32_t reconstructed = (high << 16) | low;

左移恢复高位位置，按位或合并低位，精确还原原值。

操作	运算符	用途
右移	>>	提取高位
左移	<<	定位插入位置
按位与	&	掩码提取
按位或	\|	字段合并

第四章：完整排序流程的代码构建与测试验证

4.1 主控函数radixSort的结构设计

主控函数 `radixSort` 的设计目标是实现稳定、高效的基数排序流程。该函数通过逐位分配与收集策略，完成对整数数组的非比较排序。

核心逻辑结构

函数采用循环方式处理每一位数字，从最低位开始向最高位推进，每轮使用计数排序思想进行桶分配。


void radixSort(int arr[], int n) {
    int max = getMax(arr, n);        // 获取最大值以确定位数
    for (int exp = 1; max / exp > 0; exp *= 10) {
        countingSortByDigit(arr, n, exp); // 按当前位进行排序
    }
}

上述代码中，`exp` 表示当前处理的位权（个位、十位等），`getMax` 确定排序所需的最大位数，外层循环控制位遍历。`countingSortByDigit` 负责按位分桶并回写数据。

关键参数说明

arr[]：待排序的整数数组；
n：数组长度；
exp：当前处理的位权值（1, 10, 100...）。

4.2 动态数组与辅助空间的内存管理

动态数组在运行时根据数据量变化自动调整容量，其核心在于高效的内存分配与释放策略。为避免频繁申请和释放内存，通常采用“倍增扩容”机制。

扩容策略与时间复杂度分析

当数组满时，新建一个原容量两倍的数组，并将旧元素复制过去。虽然单次扩容操作耗时 O(n)，但均摊到 n 次插入后，每次插入的平均时间复杂度仍为 O(1)。

初始容量常设为 1 或 16
扩容因子多取 1.5 或 2.0
过小导致频繁扩容，过大造成内存浪费

Go 中切片的底层实现示例

var slice []int
slice = append(slice, 1)
// 当底层数组容量不足时，append 自动触发扩容

上述代码中，append 函数会检查当前容量，若不足则调用运行时函数分配新数组并复制数据。其辅助空间开销为 O(n)，但在均摊意义上仍保持高效。

4.3 多位数逐位排序的循环控制机制

在处理多位数逐位排序时，循环控制机制是实现稳定排序的核心。通常采用按位分桶策略，从最低位到最高位依次进行分配与收集。

基数排序中的循环结构

该过程依赖嵌套循环：外层控制数位遍历，内层处理每个数字的位值分配。以三位数为例：

for digit := 0; digit < maxDigits; digit++ {
    buckets := make([][]int, 10)
    for _, num := range nums {
        bucketIndex := (num / int(math.Pow10(digit))) % 10
        buckets[bucketIndex] = append(buckets[bucketIndex], num)
    }
    // 收集各桶数据回原数组
}

上述代码中，外层循环控制当前处理的位数（个位、十位等），内层将每个数按当前位值放入对应桶中。math.Pow10(digit) 用于定位当前位，取模操作获取位值。

外层循环：控制排序轮数，每轮处理一位
内层循环：执行分配操作，将元素归入对应桶
桶结构：使用切片数组模拟 0-9 十个数字桶

4.4 测试用例设计与边界条件验证

在软件质量保障中，测试用例的设计直接影响缺陷的检出率。合理的用例应覆盖正常路径、异常输入及边界场景。

边界值分析示例

对于输入范围为 1 ≤ x ≤ 100 的函数，关键测试点包括：0（下界前）、1（下界）、50（中间）、100（上界）、101（上界后）。

典型测试用例表

用例编号	输入值	预期输出	测试类型
TC001	0	拒绝输入	边界-下溢
TC002	1	处理成功	边界-最小值
TC003	100	处理成功	边界-最大值
TC004	101	拒绝输入	边界-上溢

代码级边界验证


// validateAge 检查年龄是否在有效范围内
func validateAge(age int) bool {
    if age < 1 || age > 120 { // 边界条件：1-120岁
        return false
    }
    return true
}

该函数通过逻辑判断确保输入值处于合法区间，覆盖了典型边界条件，防止无效数据进入核心逻辑。

第五章：总结与性能优化建议

合理使用连接池配置

在高并发场景下，数据库连接管理直接影响系统吞吐量。建议根据应用负载调整连接池大小，避免资源争用或过度占用。

最大连接数应略高于峰值请求数，防止连接等待
设置合理的空闲连接回收时间，减少资源浪费
启用连接健康检查，及时剔除失效连接

SQL 查询优化实践

避免全表扫描是提升查询效率的关键。通过执行计划分析（EXPLAIN）定位慢查询，并结合索引优化。


-- 添加复合索引以覆盖查询字段
CREATE INDEX idx_user_status_created ON users (status, created_at);

-- 避免 SELECT *，仅查询必要字段
SELECT id, name, email FROM users WHERE status = 'active' AND created_at > '2023-01-01';

缓存策略设计

针对读多写少的数据，使用 Redis 作为二级缓存可显著降低数据库压力。采用缓存穿透防护机制，如布隆过滤器。

策略	适用场景	过期时间建议
本地缓存（Caffeine）	高频访问、低更新频率数据	5-10 分钟
分布式缓存（Redis）	跨节点共享数据	30 分钟 - 2 小时

异步处理与批量操作

对于非实时性要求的操作，如日志记录、通知发送，应通过消息队列异步化处理，提升主流程响应速度。批量插入时使用批处理接口：


// 使用 GORM 批量插入
db.CreateInBatches(users, 100) // 每批 100 条