目的:随机生成一个长度为5000的列表,对冒泡、插入、快速等排序进行效率测试
1、生成随机数列表
# 存放每个排序所用到的列表数据,数据相同,id不同
all_list_data = []
# 随机生成5000个100000以内的数值保存到列表内,用于排序计算效率
list_data = [random.randint(0, 100000) for i in range(5000)]
for i in range(9):
# 把每个相同数据的列表添加到总列表内,使用deepcopy每一个列表,
# 保证每次执行排序函数使用的数据列表相同
all_list_data.append(copy.deepcopy(list_data))
2、使用装饰器添加计时功能
# 定义时间装饰器,统计函数运行的时间
def get_time(fun):
def f(a):
# 开始时间
start_time = time.time()
result = fun(a)
# 结束时间
end_time = time.time()
print('总共耗时:', end_time - start_time)
return result
return f
一:冒泡排序
1、介绍:
冒泡排序(英语:Bubble Sort)是一种简单的排序算法。它重复地遍历要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。遍历数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。
2、实现:
- 比较相邻的元素。如果第一个比第二个大(升序),就交换他们两个。
- 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对。这步做完后,最后的元素会是最大的数。
- 针对所有的元素重复以上的步骤,除了最后一个。
- 持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较。
3、源码:
@get_time # 使用自定义装饰器函数
def bubble_sort(arry):
# 获得数组的长度
n = len(arry)
for i in range(n):
for j in range(1, n - i):
# 如果前者比后者大
if arry[j - 1] > arry[j]:
# 则交换两者
arry[j - 1], arry[j] = arry[j], arry[j - 1]
return arry
4、测试效果
二:对冒泡排序的两次简单优化
1、某一趟遍历如果没有数据交换,则说明已经排好序了,因此不用再进行迭代了。用一个标记记录这个状态即可。
实现代码:
@get_time
def bubble_sort2(ary):
n = len(ary)
for i in range(n):
flag = 1 # 标记
for j in range(1, n - i):
if ary[j - 1] > ary[j]:
ary[j - 1], ary[j] = ary[j], ary[j - 1]
flag = 0
if flag: # 全排好序了,直接跳出
break
return ary
测试效果:
2、记录某次遍历时最后发生数据交换的位置,这个位置之后的数据显然已经有序,不用再排序了。因此通过记录最后发生数据交换的位置就可以确定下次循环的范围了。
实现代码:
@get_time
def bubble_sort3(ary):
n = len(ary)
k = n # k为循环的范围,初始值n
for i in range(n):
flag = 1
for j in range(1, k): # 只遍历到最后交换的位置即可
if ary[j - 1] > ary[j]:
ary[j - 1], ary[j] = ary[j], ary[j - 1]
k = j # 记录最后交换的位置
flag = 0
if flag:
break
return ary
测试效果:
三:选择排序
1、介绍:
选择排序(Selection sort)是一种简单直观的排序算法。它的工作原理如下。首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。
选择排序的主要优点与数据移动有关。如果某个元素位于正确的最终位置上,则它不会被移动。选择排序每次交换一对元素,它们当中至少有一个将被移到其最终位置上,因此对n个元素的表进行排序总共进行至多n-1次交换。在所有的完全依靠交换去移动元素的排序方法中,选择排序属于非常好的一种。
2、流程分析
3、实现代码
@get_time
def select_sort(ary):
n = len(ary)
for i in range(0, n):
min = i # 最小元素下标标记
for j in range(i + 1, n):
if ary[j] < ary[min]:
min = j # 找到最小值的下标
ary[min], ary[i] = ary[i], ary[min] # 交换两者
# return ary
3、测试结果
四:插入排序
1、介绍
插入排序(英语:Insertion Sort)是一种简单直观的排序算法。它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。插入排序在实现上,在从后向前扫描过程中,需要反复把已排序元素逐步向后挪位,为最新元素提供插入空间。
2、流程分析
3、代码实现
@get_time
def insert_sort(ary):
n = len(ary)
for i in range(1, n):
if ary[i] < ary[i - 1]:
temp = ary[i]
index = i # 待插入的下标
for j in range(i - 1, -1, -1): # 从i-1 循环到 0 (包括0)
if ary[j] > temp:
ary[j + 1] = ary[j]
index = j # 记录待插入下标
else:
break
ary[index] = temp
# return ary
4、测试效果
五:希尔排序
1、介绍
希尔排序(Shell Sort)是插入排序的一种。也称缩小增量排序,是直接插入排序算法的一种更高效的改进版本。希尔排序是非稳定排序算法。该方法因DL.Shell于1959年提出而得名。 希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止。
2、基本流程
希尔排序的基本思想是:将数组列在一个表中并对列分别进行插入排序,重复这过程,不过每次用更长的列(步长更长了,列数更少了)来进行。最后整个表就只有一列了。将数组转换至表是为了更好地理解这算法,算法本身还是使用数组进行排序。
例如,假设有这样一组数[ 13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10 ],如果我们以步长为5开始进行排序,我们可以通过将这列表放在有5列的表中来更好地描述算法,这样他们就应该看起来是这样(竖着的元素是步长组成):
13 14 94 33 82
25 59 94 65 23
45 27 73 25 39
10
然后我们对每列进行排序:
10 14 73 25 23
13 27 94 33 39
25 59 94 65 82
45
将上述四行数字,依序接在一起时我们得到:[ 10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45 ]。这时10已经移至正确位置了,然后再以3为步长进行排序:
10 14 73
25 23 13
27 94 33
39 25 59
94 65 82
45
排序之后变为:
10 14 13
25 23 33
27 25 59
39 65 73
45 94 82
94
最后以1步长进行排序(此时就是简单的插入排序了)
3、流程分析
4、代码实现
@get_time
def shell_sort(ary):
n = len(ary)
gap = round(n / 2) # 初始步长 , 用round四舍五入取整
while gap > 0:
for i in range(gap, n): # 每一列进行插入排序 , 从gap 到 n-1
temp = ary[i]
j = i
while (j >= gap and ary[j - gap] > temp): # 插入排序
ary[j] = ary[j - gap]
j = j - gap
ary[j] = temp
gap = round(gap / 2) # 重新设置步长
# return ary
5、测试效果
六:归并排序
1、介绍
归并排序是采用分治法的一个非常典型的应用。归并排序的思想就是先递归分解数组,再合并数组。
将数组分解最小之后,然后合并两个有序数组,基本思路是比较两个数组的最前面的数,谁小就先取谁,取了后相应的指针就往后移一位。然后再比较,直至一个数组为空,最后把另一个数组的剩余部分复制过来即可
2、流程分析
3、代码实现
def merge_sort(ary):
if len(ary) <= 1:
return ary
num = int(len(ary) / 2) # 二分分解
left = merge_sort(ary[:num])
right = merge_sort(ary[num:])
return merge(left, right) # 合并数组
def merge(left, right):
'''合并操作,
将两个有序数组left[]和right[]合并成一个大的有序数组'''
l, r = 0, 0 # left与right数组的下标指针
result = []
while l < len(left) and r < len(right):
if left[l] < right[r]:
result.append(left[l])
l += 1
else:
result.append(right[r])
r += 1
result += left[l:]
result += right[r:]
return result
4、测试结果
七:堆排序
1、介绍
堆排序在 top K 问题中使用比较频繁。堆排序是采用二叉堆的数据结构来实现的,虽然实质上还是一维数组。二叉堆是一个近似完全二叉树 。
2、基本步骤
1、构造最大堆(Build_Max_Heap):若数组下标范围为0~n,考虑到单独一个元素是大根堆,则从下标n/2开始的元素均为大根堆。于是只要从n/2-1开始,向前依次构造大根堆,这样就能保证,构造到某个节点时,它的左右子树都已经是大根堆。
2、堆排序(HeapSort):由于堆是用数组模拟的。得到一个大根堆后,数组内部并不是有序的。因此需要将堆化数组有序化。思想是移除根节点,并做最大堆调整的递归运算。第一次将heap[0]与heap[n-1]交换,再对heap[0…n-2]做最大堆调整。第二次将heap[0]与heap[n-2]交换,再对heap[0…n-3]做最大堆调整。重复该操作直至heap[0]和heap[1]交换。由于每次都是将最大的数并入到后面的有序区间,故操作完后整个数组就是有序的了。
3、最大堆调整(Max_Heapify):该方法是提供给上述两个过程调用的。目的是将堆的末端子节点作调整,使得子节点永远小于父节点 。
3、代码实现
def heap_sort(ary):
n = len(ary)
first = int(n / 2 - 1) # 最后一个非叶子节点
for start in range(first, -1, -1): # 构造大根堆
max_heapify(ary, start, n - 1)
for end in range(n - 1, 0, -1): # 堆排,将大根堆转换成有序数组
ary[end], ary[0] = ary[0], ary[end]
max_heapify(ary, 0, end - 1)
return ary
# 最大堆调整:将堆的末端子节点作调整,使得子节点永远小于父节点
# start为当前需要调整最大堆的位置,end为调整边界
def max_heapify(ary, start, end):
root = start
while True:
child = root * 2 + 1 # 调整节点的子节点
if child > end:
break
if child + 1 <= end and ary[child] < ary[child + 1]:
child = child + 1 # 取较大的子节点
if ary[root] < ary[child]: # 较大的子节点成为父节点
ary[root], ary[child] = ary[child], ary[root] # 交换
root = child
else:
break
4、测试结果
八:快速排序
1、介绍
快速排序(英语:Quicksort),又称划分交换排序(partition-exchange sort),通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。
2、基本步骤
1、从数列中挑出一个元素,称为”基准”(pivot),
2、重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区结束之后,该基准就处于数列的中间位置。这个称为分区(partition)操作。
3、递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。
4、递归的最底部情形,是数列的大小是零或一,也就是永远都已经被排序好了。虽然一直递归下去,但是这个算法总会结束,因为在每次的迭代(iteration)中,它至少会把一个元素摆到它最后的位置去。
3、流程分析
4、代码实现
def quick_sort(ary):
return qsort(ary, 0, len(ary) - 1)
def qsort(alist, start, end):
"""快速排序"""
# 递归的退出条件
if start >= end:
return
# 设定起始元素为要寻找位置的基准元素
mid = alist[start]
# low为序列左边的由左向右移动的游标
low = start
# high为序列右边的由右向左移动的游标
high = end
while low < high:
# 如果low与high未重合,high指向的元素不比基准元素小,则high向左移动
while low < high and alist[high] >= mid:
high -= 1
# 将high指向的元素放到low的位置上
alist[low] = alist[high]
# 如果low与high未重合,low指向的元素比基准元素小,则low向右移动
while low < high and alist[low] < mid:
low += 1
# 将low指向的元素放到high的位置上
alist[high] = alist[low]
# 退出循环后,low与high重合,此时所指位置为基准元素的正确位置
# 将基准元素放到该位置
alist[low] = mid
# 对基准元素左边的子序列进行快速排序
qsort(alist, start, low - 1)
# 对基准元素右边的子序列进行快速排序
qsort(alist, low + 1, end)
5、测试效果
项目代码:排序测试代码
到此为止,简单的测试代码已经完成,由测试结果得知:冒泡比较慢,快速排序确实挺快!