关于各种排序的复杂度,网上的资料不少,谬误也比较多,更甚者以讹传讹,初学者不加分辨地记下,实在是误人子弟。你们肯定搜到过下面这张图,这个分类是没问题的。
比如下面这张图就有很多错误。其实记这些东西,知其所以然是最重要的。
最后附上我认为比较正确的总结图吧。(如果有错误请指出,一定及时改正)
另外,上图中所说的in-place和out-place并不是内排序和外排序,解释如下:
in-place 占用常数内存,不占用额外内存 out-place 占用额外内存
在冒泡排序中,为了将arr排序,借用了一个temp的临时变量,开辟了一个临时空间,这个空间是常数量,这就是in-place。
如果开辟的辅助空间与问题规模有关,则是out-place。
假设你把排序时把数组中的数按顺序放入了一个新的数组,我就开了一个n规模大小的数组,这个就与数据规模有关。
而内外排序呢:
由于待排序的记录数量不同,使得排序过程中涉及的存储器不同,可将排序方法分为两大类:内部排序与外部排序。
概念
内部排序:待排序记录存放在计算机随机存储器中(说简单点,就是内存)进行的排序过程。
外部排序:待排序记录的数量很大,以致于内存不能一次容纳全部记录,所以在排序过程中需要对外存进行访问的排序过程。
从概念我们可以清晰的看到二者的区别
衡量效率的方法
内部排序:比较次数,也就是时间复杂度
外部排序:IO次数,也就是读写外存的次数
排序方法
内部排序:插入排序、快速排序、选择排序、归并排序、基数排序等
外部排序:
先来了解下外部排序的过程吧。
外部排序基本上由两个相对独立的阶段组成。首先,按可用内存大小,将外存上含n个记录的文件分成若干长度为l的子文件或段,依次读入内存并利用有效的内部排序方法对他们进行排序,并将排序后得到的有序子文件重新写入外存,通常称这些有序子文件为归并段;然后,对这些归并段进行逐趟归并,使归并段逐渐由小至大,直至得到整个有序文件为止。
好了,读了上面这段文字之后,我们可以知道,第一阶段就是内部排序,这个我们都知道怎么做,那么第二阶段呢?也就是归并的过程是怎么实现的,常用的有两种方法,一,多路平衡归并;二,置换-选择排序
下面这篇文章,提到了一些外排序方法,其实与我们所说的十大排序算法不在一个讨论等级上
https://blog.youkuaiyun.com/xushiyu1996818/article/details/84936832