对于递归理解+归并+TimSort

最新推荐文章于 2022-11-10 14:22:31 发布

hqgordon

最新推荐文章于 2022-11-10 14:22:31 发布

阅读量131

点赞数

分类专栏：算法

本文链接：https://blog.youkuaiyun.com/weixin_43236268/article/details/115749580

版权

算法同时被 2 个专栏收录

7 篇文章

订阅专栏

数据结构与算法

6 篇文章

订阅专栏

递归

方法中调用自身方法

static long f(int n){
	if(n<1)
	 return -1;
	if (n==1)
	return 1;
	return n+f(n-1);
//一个简单的递归 返回1+2+3....+n

关键：截止条件

归并排序

思想：分而治之

TimSort

来自：https://www.cnblogs.com/sunshuyi/p/12680918.html
java将timsort用于对象数组排序
在非随机数组上是战胜了快排的
当Timsort运行在部分排序好的数组里面的时候，需要的比较次数要远小于nlogn，也是远小于相同情况下的归并排序算法需要的比较次数。但是和其他的归并排序算法一样，最坏情况下的时间复杂度是O(nlogn)的水平。但是在最坏的情况下，Timsort需要的临时存储空间只有n/2，在最好的情况下，需要的额外空间是常数级别的。从各个方面都能够击败需要O(n)空间和稳定O(nlogn)时间的归并算法。

Run

所谓的run就是一个连续上升（此处的上升包括两个元素相等的情况）或者下降（严格递减）的子串。

比如对于序列[1,2,3,4,3,2,4,7,8]，其中有三个run，第一个是[1,2,3,4]，第二个是[3,2]，第三个是[4,7,8]，这三个run都是单调的，在实际程序中对于单调递减的run会被反转成递增的序列。

在合并序列的时候，如果run的数量等于或者略小于2的幂次方的时候，效率是最高的；如果略大于2的幂次方，效率就会特别低。所以为了提高合并时候的效率，需要尽量控制每个run的长度，定义一个minrun表示每个run的最小长度，如果长度太短，就用二分插入排序把run后面的元素插入到前面的run里面。对于上面的例子，如果minrun=5，那么第一个run是不符合要求的，就会把后面的3插入到第一个run里面，变成[1,2,3,3,4]。
在执行排序算法之前，会计算出这个minrun的值（所以说这个算法是自适应的，会根据数据的特点来进行自我调整），minrun会从32到64（包括）选择一个数字，使得数组的长度除以minrun等于或者略小于2的幂次方。比如长度是65，那么minrun的值就是33；如果长度是165，minrun就是42（注意这里的Java的minrun的取值会在16到32之间）。

private static int minRunLength(int n) {
    assert n >= 0;
    int r = 0;        // 如果低位任何一位是1，就会变成1
    while (n >= 64) { // 改成了64
        r |= (n & 1);
        n >>= 1;
    }
    return n + r;
}

合并
在归并算法中合并是两两分别合并，第一个和第二个合并，第三个和第四个合并，然后再合并这两个已经合并的序列。但是在Timsort中，合并是连续的，每次计算出了一个run之后都有可能导致一次合并，这样的合并顺序能够在合并的同时保证算法的稳定性。

在Timsort中用一个栈来保存每个run，比如对于上面的[1,2,3,4,3,2,4,7,8]这个例子，栈底是[1,2,3,4]，中间是[3,2]，栈顶是[4,7,8]，每次合并仅限于栈里面相邻的两个run。
合并条件
为了保证Timsort的合并平衡性，Tim制定一个合并规则，对于在栈顶的三个run，用X、Y和Z分别表示他们的长度，其中X在栈顶，必须始终维持一下的两个规则：

Z>Y+X
Y>X

一旦有其中的一个条件不被满足，Y这个子序列就会和X于Z中较小的元素合并形成一个新run，然后会再次检查栈顶的三个run看看是否仍然满足条件。如果不满足则会继续进行合并，直至栈顶的三个元素（如果只有两个run就只需要满足第二个条件）满足这两个条件。
所谓的合并的平衡性就是为了让合并的两个数组的大小尽量接近，提高合并的效率。所以在合并的过程中需要尽量保留这些run用于发现后来的模式，但是我们又想尽量快的合并内存层级比较高的run，并且栈的空间是有限的，不能浪费太多的栈空间。通过以上的两个限制，可以将整个栈从底部到顶部的run的大小变成严格递减的，并且收敛速度和斐波那契数列一样，这样就可以应用斐波那契数列和的公式根据数组的长度计算出需要的栈的大小，一定是比log1.618N要小的，其中N是数组的长度。

在最理想的情况下，这个栈从底部到顶部的数字应该是128、64、32、16、8、4、2、2，这样从栈顶合并到栈底，每次合并的两个run的长度都是相等的，都是完美的合并。

如果遇到不完美的情况比如500、400、1000，那么根据规则就会合并变成900、1000，再次检查规则之后发现还是不满足，于是合并变成了1900。

合并内存消耗
不使用额外的内存合并两个run是很困难的，有这种原地合并算法，但是效率太低，作为trade-off，可以使用少量的内存空间来达到合并的目的。

比如有两个相邻的run一前一后分别是A和B，如果A的长度比较小，那么就把A复制到临时内存里面，然后从小到大开始合并排序放入A和B原来的空间里面不影响原来的数据的使用。如果B的长度比较小，B就会被放到临时内存里面，然后从大到小开始合并。

另外还有一个优化的点在于可以用二分法找到B[0]在A中应该插入的位置i以及A[A.length-1]在B中应该插入的位置j，这样在i之前和j之后的数据都可以放在原地不需要变化，进一步减小了A和B的大小，同时也是缩减了临时空间的大小。
加速合并
在归并排序算法中合并两个数组就是一一比较每个元素，把较小的放到相应的位置，然后比较下一个，这样有一个缺点就是如果A中如果有大量的元素A[i…j]是小于B中某一个元素B[k]的，程序仍然会持续的比较A[i…j]中的每一个元素和B[k]，增加合并过程中的时间消耗。

为了优化合并的过程，Tim设定了一个阈值MIN_GALLOP，如果A中连续MIN_GALLOP个元素比B中某一个元素要小，那么就进入GALLOP模式，反之亦然。默认的MIN_GALLOP值是7。

在GALLOP模式中，首先通过二分搜索找到A[0]在B中的位置i0，把B中i0之前的元素直接放入合并的空间中，然后再在A中找到B[i0]所在的位置j0，把A中j0之前的元素直接放入合并空间中，如此循环直至在A和B中每次找到的新的位置和原位置的差值是小于MIN_GALLOP的，这才停止然后继续进行一对一的比较。

GALLOP模式
GALLOP搜索元素分为两个步骤，比如我们想找到A中的元素x在B中的位置

第一步是在B中找到合适的索引区间(2k−1,2k+1−1)使得x在这个元素的范围内

第二步是在第一步找到的范围内通过二分搜索来找到对应的位置。

通过这种搜索方式搜索序列B最多需要2lgB次的比较，相比于直接进行二分搜索的lg(B+1)次比较，在数组长度比较短或者重复元素比较多的时候，这种搜索方式更加有优势。

这个搜索算法又叫做指数搜索（exponential search），在Peter McIlroy于1993年发明的一种乐观排序算法中首次提出的。

总结
总结一下上面的排序的过程：

如果长度小于64直接进行插入排序
首先遍历数组收集每个元素根据特定的条件组成一个run
得到一个run之后会把他放入栈中
如果栈顶部几个的run符合合并条件，就会触发合并操作合并相邻的两个run留下一个run
合并操作会使用尽量小的内存空间和GALLOP模式来加速合并

来自：https://www.cnblogs.com/sunshuyi/p/12680918.html