基于比较的排序算法
基础排序
一、冒泡排序
谁大谁大,每一轮都把最大的顶到天花板
效率太低(n^2)--掌握swap
二、选择排序
效率较低,但经常用他内部的循环方式来找最大值和最小值--怎么一次性求出数组的最大值和最小值
O(n^2)
三、插入排序
虽然平均效率低,但是在序列基本有序时,它很快,所以也有其适用范围
Arrays这个工具类在1.7里面做了较大改动(java)
四、希尔排序(缩小增量排序)
是插入排序的改良,对空间思维训练有帮助
时间复杂度大概是(n^1.3)
分治法
1.子问题拆分
2.递归求解子问题
3.合并子问题的解
五、快速排序
快排是软件工业中最常见的常规排序算法,其**双向指针扫描**和**分区**算法是核心,往往用于解决类似问题,特别是patition算法用来划分不同性质的元素,
patition->selectK也用于著名的topk问题
O(NlgN),但如果主元不是中位数的话,特别是如果每次主元都在数组区间的一侧,复杂度会上升到O(n²)
工业优化:三点去中法、绝对中值法,小数据量用插入排序
快排重视子问题划分
六、归并排序
空间换时间--逆序对数
归并重视子问题的解的合并
七、堆排序
用到了二叉树的数据结构,是继续掌握树状结构的起手式
相当于插入排序+二分查找
上面三个都是NlgN的复杂度,其中快排的表现好一些,是原址的,不用开辟辅助空间,堆排也是原址的,但是常数因子较大,不具备优势。(堆排可以用于海量数据流的排序,也有其用武之地)
上面七种都是基于比较的排序,可证明它们在元素随机情况下的最好时间复杂度为NlgN,用决策树证明
下面三个是非比较排序,在特定情况下会比基于比较的排序要快。
非比较排序
八、计数排序
可以说是最快的:O(N+K),K = maxOf(sourceArr),用它来解决问题是必须注意如果序列中的值分布比较广(最大值很大,元素分布很稀疏),空间将会浪费很多,所以计数排序的适用范围是: **序列的关键字比较集中,已知边界,且边界较小**
九、桶排序
先分桶,再用其他排序算法对桶内元素排序,按桶的编号依次检出。(分配-收集)
用它解决问题时必须注意,序列的值是否均匀的分布在桶中。如果不均匀,那么个别桶中的元素会远远多于其他桶,桶内排序用比较排序,极端情况下,全部的元素都集中在了一个桶里,还是会退化成NlgN。
其时间复杂度为:O(N+C),其中C=N*(logN-logM),约等于N*lgN,其中N是元素个数,M是桶的个数。
十、基数排序
KN级别(K是最大数的位数)是整数数值类型里排序又稳又快的,无论元素分布如何,只开辟固定的辅助空间(10个桶)
对比桶排序,技术排序每次需要的桶的数量不多。而且基数排序几乎不需要人格“比较”操作,桶内的多个数据必须进行基于比较操作的排序。
因此,在实际应用中,对十进制数排序而言,基数排序更好用。
期望水准:
1、准确描述算法过程
2、写出伪代码
3、能分析时间复杂度
4、能灵活应用