归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;注意要先使每个子序列有序,再使子序列段间有序。
例如:
有数列{6,202,100,301,38,8,1}
初始状态:6,202,100,301,38,8,1
第一次归并后:{6,202},{100,301},{8,38},{1}
第二次归并后:{6,100,202,301},{1,8,38}
第三次归并后:{1,6,8,38,100,202,301}
python代码实现:
def merge(a,b): #合并两个有序子序列a,b
c = []
i = j = 0
while i < len(a) and j < len(b): #比较,并把小数放到新序列c中
if a[i] < b[j]:
c.append(a[i])
i+=1
else:
c.append(b[j])
j+=1
if i == len(a): #当其中某个子序列中的数都被放到新序列中的时候,将另一个子序列剩下的数都放到新序列中
for x in b[j:]
c.append(x)
else:
for x in a[i:]
c.append(x)
return c
def merge_sort(list): #归并排序
if len(list)<=1:
return list
middle = len(list)/2 #将list分为左右两份
left = merge_sort(list[:middle])
right = merge_sort(list[middle:])
return merge(left, right) #合并
性能分析:
归并排序实现的主要实现的原理是由上至下递归的二分原数组,并由下至上递归的合并二分后的子数组,由于每次数组的分裂都需要建立两个新的数组,所以其实归并排序的空间复杂度是较高的,可达O(n)。在这里,可能有些小伙伴会在空间复杂度到底是O(n)还是O(nlogn)之间存在疑惑,因为由代码可以得出归并算法的整个过程会复制logn个大小为n的数组,那为什么空间复杂度不是O(nlogn)呢?原因是程序的执行是在线程栈中,一次方法的调用和返回代表着一个栈帧的入栈和出栈,栈帧出栈后,该栈帧中的临时变量所占用的空间都会得到释放。
由于递归拆分为子序列的时间复杂度是O(logn ),而进行两个有序数组排序的方法复杂度是O(n), 则该算法的时间复杂度是O(n*logn) 。