常见排序算法
直接插入
希尔排序
冒泡排序
快速排序
简单选择
堆排序
归并排序
基数排序
由于计数排序可能需要占用非常大的内存,故基数排序是计数排序的内存优化版,即分别对每一位进行“计数排序”,注意处于同一“数位”的若干数,需要依次进入数位的队列,出列是服从先进先出的策略。
计数排序:当输入的元素是 n 个 0 到 k 之间的整数时,它的运行时间是 Θ(n + k)。计数排序不是比较排序,排序的速度快于任何比较排序算法。
对于数据范围不大,比如小范围整形适用。对于大范围数据,或者字符串不太适用。
桶排序:通过函数映射(可以是hash)将数据放到桶中(可以是链表),在对链表中的数据进行排序。
对N个关键字进行桶排序的时间复杂度分为两个部分:
(1) 循环计算每个关键字的桶映射函数,这个时间复杂度是O(N)。
(2) 利用先进的比较排序算法对每个桶内的所有数据进行排序,其时间复杂度为 ∑ O(NilogNi) 。其中Ni 为第i个桶的数据量。
尽量减少桶内数据的数量是提高效率的唯一办法(因为基于比较排序的最好平均时间复杂度只能达到O(NlogN)了)。因此,我们需要尽量做到下面两点:
(1) 映射函数f(k)能够将N个数据平均的分配到M个桶中,这样每个桶就有[N/M]个数据量。
(2) 尽量的增大桶的数量。极限情况下每个桶只能得到一个数据,这样就完全避开了桶内数据的“比较”排序操作。
当N=M时,即极限情况下每个桶只有一个数据时。桶排序的最好效率能够达到O(N)。
总结: 桶排序的平均时间复杂度为线性的O(N+C),其中C=N*(logN-logM)。如果相对于同样的N,桶数量M越大,其效率越高,最好的时间复杂度达到O(N)。 当然桶排序的空间复杂度 为O(N+M)。
比较:hash表的查找效率在不冲突的情况下为O(1),类似于每个桶只有一个数据的桶排序的思想。
特点
稳定的排序算法
直接插入
冒泡
归并
基数
计数排序
桶排序
基于比较的排序算法
除了基数排序,计数排序和桶排序不是,其他都是基于比较的排序。
基于比较的排序的时间效率的下限是O(nlogn),原因在于每一次比较,最多砍掉一半的可能性。