归并排序(Merge Sort)是一种分治(Divide and Conquer)策略的排序算法。下面我将详细解释归并排序的时间复杂度和空间复杂度。
时间复杂度
- 分解(Divide):将待排序的序列分成两个等长的子序列。这一步的时间复杂度为O(1),因为它只是计算中间索引,并没有进行实际的排序操作。
- 递归解决(Conquer):对这两个子序列分别进行归并排序。这一步的时间复杂度是递归的,假设对长度为n的序列进行归并排序的时间复杂度为T(n),那么对两个长度为n/2的子序列进行归并排序的时间复杂度就是2T(n/2)。
- 合并(Merge):将两个已排序的子序列合并成一个有序序列。这一步的时间复杂度为O(n),因为需要遍历两个子序列的所有元素。
因此,归并排序的总时间复杂度T(n)满足以下递推关系:
T(n) = 2T(n/2) + O(n)
这是一个典型的分治策略递推式。使用主定理(Master Theorem)可以解得T(n) = O(nlogn)。所以,归并排序的时间复杂度为O(nlogn)。
主定理(Master Theorem)是用于解决分治算法(特别是递归分治算法)时间复杂度的工具。对于形如 T(n) = aT(n/b) + f(n)
的递推式,其中 a >= 1, b > 1
是常数,f(n)
是另一个函数,主定理可以帮助我们直接得出 T(n)
的渐近复杂度。
归并排序的递推式是 T(n) = 2T(n/2) + O(n)
,其中 a = 2, b = 2
,且 f(n) = O(n)
。
主定理有三种情况:
- 如果
f(n) = O(n^(log_b(a) - ε))
对于某个常数ε > 0
成立,则T(n) = Θ(n^(log_b(a)))
。 - 如果
f(n) = Θ(n^(log_b(a)))
,且af(n/b) <= cf(n)
对于某个常数c < 1
和所有足够大的n
成立,则T(n) = Θ(n^(log_b(a)) log n)
。 - 如果
f(n) = Ω(n^(log_b(a) + ε))
对于某个常数ε > 0
成立,且af(n/b) >= cf(n)
对于某个常数c > 1
和所有足够大的n
成立,则T(n) = Θ(f(n))
。
对于归并排序的递推式 T(n) = 2T(n/2) + O(n)
,我们有:
a = 2
b = 2
f(n) = O(n)
计算 log_b(a) = log_2(2) = 1
。
因为 f(n) = O(n)
正好等于 n^(log_b(a))
(即 n^1
),我们需要检查第二种情况中的附加条件 af(n/b) <= cf(n)
是否成立。对于归并排序,这个条件实际上是成立的,因为合并两个已排序的子数组的时间复杂度是线性的,不会随着递归深度的增加而显著增加。
因此,根据主定理的第二种情况,我们得出 T(n) = Θ(n log n)
。用大写O表示渐近上界,即 T(n) = O(n log n)
。
这意味着归并排序的时间复杂度是线性对数级别的,即对于输入大小为n的数组,归并排序需要大约 n log n
次基本操作。
空间复杂度
归并排序的空间复杂度主要来自合并(Merge)过程中所需的辅助空间。
- 递归栈空间:由于归并排序是递归的,因此需要使用递归栈来保存每一层的局部变量和返回地址。在最坏情况下,递归栈的深度为logn(因为每次递归都将问题规模减半)。但是,由于每一层递归栈的空间复杂度是O(1),所以总的递归栈空间复杂度为O(logn)。但是,这通常不是空间复杂度的主要部分,因为现代操作系统中栈空间通常是。很大的
- 合并所需空间:在合并两个已排序的子序列时,需要一个临时数组来保存合并后的结果。这个临时数组的大小为n,因此空间复杂度为O(n)。
因此,归并排序的空间复杂度主要由合并过程所需的辅助空间决定,即O(n)。
需要注意的是,虽然归并排序的空间复杂度为O(n),但它是原地排序(in-place sorting)的对立面。原地排序算法在排序过程中只需要使用O(1)的额外空间(除了存储输入数据的空间外)。然而,归并排序需要额外的O(n)空间来辅助排序过程。这是归并排序的一个主要缺点,尤其是在处理大规模数据时。