【算法】桶排序和基数排序

桶排序

假设我们要对n个整数排序,而且这n个数的大小在区间[0,m]之内。那么我们可以设置m+1个”桶”来表示区间内的m+1个数,用数组bucket[m+1]表示。然后遍历n个待排数据,将每个数字放入到它对应的”桶”中。最后我们按照”桶号”递增的顺序将n个数字一次从”桶”中取出,那么取出的数字序列就是排序后的序列了。
桶排序使用了hash的思想,将n个数散列在了m个”桶”中,然后利用桶固有的顺序将数据取出,从而使得待排数据有序。这种方法避免了通过比较数据大小来排序,时间复杂度降到了O(n+m)。是一种典型的空间换时间的算法。

代码

//参数n表示待排数据的范围内数字的个数
//bucket[i]的值表示i号桶中重复数据的个数
//如果待排数组的范围不是从0开始的,而是区间[l,r]
//可以在排序前将所有数据减去l,排序后再加回来
void bucket_sort(vector<int> &A, int n)
{
    vector<int> bucket(n, 0);

    for(int i = 0; i < A.size(); i++){
        bucket[A[i]]++;
    }

    for(int i = 0, j = 0; i < n; i++){
        for(int k = 0; k < bucket[i]; k++)
            A[j+k] = i;
        j += bucket[i];
    }
}

基数排序

基数排序是在桶排序上的改进,能够节约很多空间。它的思想是这样的:对于待排序的整数序列,从整数的低位开始,依次对该位进行桶排序,直到排完最高位,所得的序列即是有序的。

代码

//这里的n表示整数的位,从0开始,依次表示个位,十位,百位。。。
void bucket_sort(vector<int> &A, int n)
{
    vector<vector<int> > buckets(10);

    //将数字第n位的数作为索引,将数字存入对应的桶中
    for(int i = 0; i < A.size(); i++){
        buckets[(A[i] / (int)pow(10,n))%10].push_back(A[i]);
    }
    //将数字依次从桶中取出,放回到原来的数组
    for(int i = 0, j = 0; i < 10; i++){
        for(int k = 0; k < buckets[i].size(); k++)
            A[j+k] = buckets[i][k];
        j += buckets[i].size();
    }
}

//这里的n表示待排数据中的最高位
void radix_sort(vector<int> &A, int n)
{
    for(int i = 0; i < n; i++)
        bucket_sort(A, i);
}
### 不同排序算法的时间复杂度应用场景 #### 时间复杂度对比 对于 `sort` 函数,在 Python 中通常指的是 Timsort 算法,这是一种混合排序算法,源自归并排序插入排序。Timsort 的平均时间复杂度为 O(n log n),最坏情况下也是 O(n log n)[^1]。 桶排序是一种分布式的排序方法,其基本思想是将数组中的元素分配到有限数量的桶中,每个桶再分别进行排序(可以使用其他排序算法)。理想条件下,当输入均匀分布在各个桶中时,桶排序能够实现线性时间复杂度 O(n);然而,如果所有元素集中在少数几个桶甚至同一个桶,则性能会退化至接近于所使用的内部排序算法的时间复杂度[^2]。 基数排序同样基于分配的概念,但它不是按数值大小而是按照数字的位置来划分数据项进入不同的“桶”。它适用于整数或字符串类型的固定长度记录。由于每次处理的是单一位上的值,因此理论上可以在 O(d * (n + b)) 的时间内完成排序操作,其中 d 表示关键字的最大位数,b 是基数(即可能的不同字符的数量),而 n 则代表待排序的数据量。在很多实际应用场合下,d b 都是可以视为常数的因素,所以整体上也可以认为具有近似线性的效率[^3]。 ```python def bucket_sort(arr): from math import floor max_val = max(arr) size = max_val / len(arr) buckets_list = [[] for _ in range(len(arr))] for i in range(len(arr)): index = int(floor(arr[i]/size)) if index != len(arr): buckets_list[index].append(arr[i]) else: buckets_list[len(arr)-1].append(arr[i]) final_output = [] for sublist in buckets_list: sorted_sublist = sorted(sublist) # 使用内置 sort 方法对各桶内元素排序 final_output.extend(sorted_sublist) return final_output def radix_sort(nums): RADIX = 10 placement = 1 max_digit = max(nums) while placement <= max_digit: # 初始化buckets作为临时存储空间 buckets = [list() for _ in range(RADIX)] for i in nums: tmp = int((i / placement) % RADIX) buckets[tmp].append(i) a = 0 for b in range(RADIX): buck = buckets[b] for i in buck: nums[a] = i a += 1 placement *= RADIX return nums ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值