基数排序是学习后缀数组的基础,本身并不复杂,适用于待比较的元素的位数较少的情况,复杂度为O(d*(n+radix)),d为关键码的个数,radix为关键码的取值范围,n为元素个数,比如说对1000万个正整数排序,整数取值范围(0,100],则复杂度为3*(1000万+10),比快速排序nlogn的效率更高。
基数排序的原理也不复杂,回忆小时候排序的过程,给定一堆数,比如 11,23,98,45,178,22,773,怎么排成非递减的顺序呢,我们先看位数最多的,然后比较最高位,最高位相同比较次高位,这样就成功排序了,这在基数排序中被称为MSD(Most Significant Digit first)最高位优先,先排序低位再调整可以吗,当然了,这叫做LSD(Least Significant Digit first)最低位优先,这也是我们讨论的重点:
原数据:11,23,98,45,178,22,773
别的不管,先按照个位排序,得到11,22,23,773,45,98,178
在个位的基础上按照十位排序11,22,23,45,773,98,178(后两位递增)
在十位的基础上按照百位排序11,22,23,45,98,178,773(后三位递增)
什么叫做在个位的基础上对十位排序呢,可以明确的是,个位上的排序我们确定了第i个元素的个位一定小于等于第j( j > i )个元素的个位,这样我们在十位比较的时候顺序处理就可以了,例如,当我们从右到左依次把十位是2的数放到一个数组时,先放的数一定是后两位数十位为2的数中的最大值。在十位的基础上按照百位排序同理
代码并不难理解,唯一需要注意的地方就只有确保稳定排序了(值相等时保持原来的数列的前后顺序)
#include <cstdio>
#include <cmath>
#include <cstring>
#include <iostream>
#include <algorithm>
using namespace std;
void mysort(int arr[],int n)
{
int d = 3; //关键码只有三位
const int radix = 10; //每位的取值范围都在[0,9]
int *bucket = new int[radix * sizeof(int)]; //存放三次排序的中间结果,bucket[i] = x第i小的数是x
int cnt[radix];
for(int k = 1; k <= d; k++)
{
memset(cnt,0,sizeof(cnt));
for(int i = 0; i < n; i++) //记录每种关键码出现的次数
{
int x = arr[i]/(int)pow(10,k-1)%10; //取出arr[i]的倒数第k位
cnt[x]++;
}
//计算关键码排名,cnt[i] = x表示关键码为i时,排名范围是[cnt[i-1]+1,cnt[i]]大
for(int i = 1; i < radix; i++) cnt[i] += cnt[i-1];
for(int i = n-1; i >= 0; i--) //保证稳定排序
{
int x = arr[i]/(int)pow(10,k-1)%10; //取出arr[i]的倒数第k位
bucket[cnt[x]-1] = arr[i]; //下标从0开始
--cnt[x];
}
for(int i = 0; i < n; i++) arr[i] = bucket[i];
}
delete bucket;
}
int main()
{
int a[10] = {102,56,98,34,998,452,27,9,85,43};
mysort(a,10);
for(int i = 0; i < 10; i++) printf("%d ",a[i]);
printf("\n");
return 0;
}