文章参考八大排序算法和8大排序算法图文讲解
排序算法可以分为内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。
常见的内部排序算法有:插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等。
快速排序:是目前基于比较的内部排序中被认为是最好的方法,当待排序的关键字是随机分布时,快速排序的平均时间最短;
本文将依次介绍上述八大排序算法。
算法一:插入排序
插入排序示意图
插入排序是一种最简单直观的排序算法,它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。
时间复杂度:O(n^2)
其他的插入排序有二分插入排序,2-路插入排序
算法步骤:
1)将第一待排序序列第一个元素看做一个有序序列,把第二个元素到最后一个元素当成是未排序序列,即以第一个元素为基准。
2)从头到尾依次扫描未排序序列,将扫描到的每个元素插入有序序列的适当位置。(如果待插入的元素与有序序列中的某个元素相等,则将待插入元素插入到相等元素的后面。)
要点:设立哨兵,作为临时存储和判断数组边界之用。
直接插入排序示例:

如果碰见一个和插入元素相等的,那么插入元素把想插入的元素放在相等元素的后面。所以,相等元素的前后顺序没有改变,从原无序序列出去的顺序就是排好序后的顺序,所以插入排序是稳定的。
算法的实现:
<span style="font-size:18px;"><span style="color: rgb(51, 51, 255);"> </span> /**
* 插入排序算法
* @param arr 待排序数组的引用
*/
public static void insertSort(int[] arr) {
int key; // 哨兵,保存当前要进行插入排序的值,作为基准
int j; // 待排序数据的位置
int i; // 已经排好序的下标
// 以第一个为基准,从数组的第二个位置开始遍历值
for (j = 1; j < arr.length; j++) {
key = arr[j]; // 保存当前待比较的数值作为哨兵
i = j - 1;
// a[i]比当前值大时,a[i]后移一位,空出i的位置,好让下一次循环的值后移
while (<strong>i >= 0</strong> && arr[i] > key) {
arr[i + 1] = arr[i];
i--;
}
arr[i + 1] = key;
// 打印每次的排序输出
printArray(arr);
}
}</span>
问题1:a[i]第一次进行右移时覆盖了a[i+1]值,是否造成了数据丢失?
答:不会造成数据丢失,应为第一次右移前的i+1=j,此时a[j]的值存在了key里了。每次右移都为下一次右移或插入留出了位置,这就是插入排序的关键点所在。
希尔排序示意图
希尔排序,也称递减增量排序算法,是插入排序的一种更高效的改进版本。但希尔排序是非稳定排序算法。
希尔排序是基于插入排序的以下两点性质而提出改进方法的:
- 插入排序在对几乎已经排好序的数据操作时, 效率高, 即可以达到线性排序的效率
- 但插入排序一般来说是低效的,因为插入排序每次只能将数据移动一位
希尔排序的基本思想是:先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序,待整个序列中的记录“基本有序”时,再对全体记录进行依次直接插入排序。
算法步骤:
1)选择一个增量序列t1,t2,…,tk,其中ti>tj,tk=1;
2)按增量序列个数k,对序列进行k 趟排序;
3)每趟排序,根据对应的增量ti,将待排序列分割成若干长度为m 的子序列,分别对各子表进行直接插入排序。仅增量因子为1 时,整个序列作为一个表来处理,表长度即为整个序列的长度。
希尔排序的示例:
算法实现:
我们简单处理增量序列:增量序列d = {n/2 ,n/4, n/8 .....1} n为要排序数的个数
即:先将要排序的一组记录按某个增量d(n/2,n为要排序数的个数)分成若干组子序列,每组中记录的下标相差d.对每组中全部元素进行直接插入排序,然后再用一个较小的增量(d/2)对它进行分组,在每组中再进行直接插入排序。继续不断缩小增量直至为1,最后使用直接插入排序完成排序。
/**
* 希尔排序算法 对直接插入排序进行改进
* 先按增量d(arrLength/2,arrLength为要排序数组的长度
*/
public static void shellSort(int arr[]) {
int temp; // 哨兵,保存当前要进行插入排序的值,作为基准
int j; // 待排序数据的位置
int i; // 已经排好序的下标
int gap = arr.length; // 分组的间隔
// 以第一个为基准,从数组的第二个位置开始遍历值
do {
gap = gap / 2; // 如果此处gap为1,则退化为直接插入排序
for (j = gap; j < arr.length; j++) {
temp = arr[j]; // 保存当前待比较的数值作为哨兵
i = j - gap;
// a[i]比当前值大时,a[i]后移一位,空出i的位置,好让下一次循环的值后移
while (i >= 0 && arr[i] > temp) {
arr[i + gap] = arr[i];
i -= gap;
}
arr[i + gap] = temp;
}
// 打印每次的排序输出
printArray(arr);
} while (gap > 1);
}
算法三:选择排序-简单选择排序
选择排序示意图
选择排序(Selection sort)也是一种简单直观的排序算法。
算法步骤:
第一趟,从n 个记录中找出关键码最小的记录与第一个记录交换;
第二趟,从第二个记录开始的n-1 个记录中再选出关键码最小的记录与第二个记录交换;
以此类推.....
第i 趟,则从第i 个记录开始的n-i+1 个记录中选出关键码最小的记录与第i 个记录交换,
直到整个序列按关键码有序。
排序示例:
算法实现:
/**
* 选择排序
* @param arr
*/
public static void selectSort(int[] arr) {
int minIndex, temp;
for (int i = 0; i < arr.length; i++) {
minIndex = getMinimumIndex(arr, i); // 获取从i开始后的最小值的下标
if (minIndex != i) { // 如果此处i就是最小值则不需要交换
temp = arr[i];
arr[i] = arr[minIndex];
arr[minIndex] = temp;
}
printArray(arr);
}
}
/**
* 获取数组从i位置之后中最小数据的下标
* @param arr
* @param from 从from之后
* @return
*/
public static int getMinimumIndex(int[] arr, int from) {
int minimum = arr[from];
int minIndex = from;
for (int j = from + 1; j < arr.length; j++) {
if (arr[j] < minimum) {
minIndex = j;
minimum = arr[j];
}
}
return minIndex;
}
简单选择排序的改进——二元选择排序
简单选择排序,每趟循环只能确定一个元素排序后的定位。我们可以考虑改进为每趟循环确定两个元素(当前趟最大和最小记录)的位置,从而减少排序所需的循环次数。改进后对n个数据进行排序,最多只需进行[n/2]趟循环即可。具体实现如下:( 此算法要考虑很多问题,如果有错误的地方,希望大家提出来,共同学习~) 具体可能出现的bug可参考点击打开链接(此博主的算法也是有问题的~)
* 二元选择排序
* @param arr
*/
public static void selectSort(int[] arr) {
int tmp;
int n = arr.length;
int minIndex, maxIndex;
for (int i = 0; i < n / 2; i++) { // 去掉=
minIndex = i;
maxIndex = i;
for (int j = i; j <= n - i - 1; j++) { // 加上=
if (arr[j] > arr[maxIndex]) {
maxIndex = j;
continue;
}
if (arr[j] < arr[minIndex]) {
minIndex = j;
}
}
System.out.print("max="+arr[maxIndex] + ",min="+arr[minIndex]+": ");
if (maxIndex == i && minIndex == n - i - 1) {
//特殊交换位置一,当最大的交换位置和最小的交换位置都在最前面和最后面
tmp = arr[maxIndex];
arr[maxIndex] = arr[minIndex];
arr[minIndex] = tmp;
} else if (maxIndex == i) {
//特殊交换位置二,当最大的交换位置是最前面
tmp = arr[maxIndex];
arr[maxIndex] = arr[n - i - 1];
arr[n - i - 1] = tmp;
tmp = arr[minIndex];
arr[minIndex] = arr[i];
arr[i] = tmp;
} else if (minIndex == n - i - 1) {
//特殊交换位置三,当最小的交换位置是最后面
tmp = arr[minIndex];
arr[minIndex] = arr[i];
arr[i] = tmp;
tmp = arr[maxIndex];
arr[maxIndex] = arr[n - i - 1];
arr[n - i - 1] = tmp;
} else {
//除了上面三种特殊交换,就剩普通交换了,普通交换随便哪个先交换都行
tmp = arr[minIndex];
arr[minIndex] = arr[i];
arr[i] = tmp;
tmp = arr[maxIndex];
arr[maxIndex] = arr[n - i - 1];
arr[n - i - 1] = tmp;
}
printArray(arr); // 数组输出函数
}
}
算法四:冒泡排序
冒泡排序示意图
冒泡排序(Bubble Sort)也是一种简单直观的排序算法。它重复地走访过要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。
算法步骤:
1)比较相邻的元素。如果第一个比第二个大,就交换他们两个。
2)对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对。这步做完后,最后的元素会是最大的数。
3)针对所有的元素重复以上的步骤,除了最后一个。
4)持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较。
基本思想:
在要排序的一组数中,对当前还未排好序的范围内的全部数,自上而下对相邻的两个数依次进行比较和调整,让较大的数往下沉,较小的往上冒(交换)。即:每当两相邻的数比较后发现它们的排序与排序要求相反时,就将它们互换。
冒泡排序的示例:
算法的实现:
<span style="white-space:pre"> </span>/**
* 冒泡排序
* @param arr
*/
public static void bubbleSort(int[] arr) {
int temp;
for (int i = 0; i < arr.length-1; i++) {
for (int j = 0; j < arr.length - i -1; j++) {
if (arr[j] > arr[j+1]) {
temp = arr[j];
arr[j] = arr[j+1];
arr[j+1] = temp;
}
}
printArray(arr);
}
// for (int i = 0; i < arr.length-1; i++) {
// for (int j = i + 1; j < arr.length; j++) {
// if (arr[i] > arr[j]) {
// temp = arr[i];
// arr[i] = arr[j];
// arr[j] = temp;
// }
// }
// printArray(arr);
// }
}
冒泡排序算法的改进
对冒泡排序常见的改进方法是加入一标志性变量exchange,用于标志某一趟排序过程中是否有数据交换,如果进行某一趟排序时并没有进行数据交换,则说明数据已经按要求排列好,可立即结束排序,避免不必要的比较过程。本文再提供以下两种改进算法:
1.设置一标志性变量pos,用于记录每趟排序中最后一次进行交换的位置。由于pos位置之后的记录均已交换到位,故在进行下一趟排序时只要扫描到pos位置即可。
改进后算法如下:
public static void bubbleSort2(int arr[]) {
int i = arr.length - 1; // 初始时,最后位置保持不变
int temp;
while (i > 0) {
int pos = 0; // 每趟开始时,无记录交换
for (int j = 0; j < i; j++)
if (arr[j] > arr[j + 1]) {
pos = j; // 记录交换的位置
temp = arr[j];
arr[j] = arr[j + 1];
arr[j + 1] = temp;
}
i = pos; // 为下一趟排序作准备
ArrayUtil.printArray(arr);
}
}
2.传统冒泡排序中每一趟排序操作只能找到一个最大值或最小值,我们考虑利用在每趟排序中进行正向和反向两遍冒泡的方法一次可以得到两个最终值(最大者和最小者) , 从而使排序趟数几乎减少了一半。
改进后的算法实现为:
public static void bubbleSort3 ( int arr[]){
int low = 0;
int high= arr.length -1; //设置变量的初始值
int temp,j;
while (low < high) {
for (j= low; j< high; ++j) //正向冒泡,找到最大者
if (arr[j]> arr[j+1]) {
temp = arr[j]; arr[j]=arr[j+1];arr[j+1]=temp;
}
--high; //修改high值, 前移一位
for ( j=high; j>low; --j) //反向冒泡,找到最小者
if (arr[j]<arr[j-1]) {
temp = arr[j]; arr[j]=arr[j-1];arr[j-1]=temp;
}
++low; //修改low值,后移一位
ArrayUtil.printArray(arr);
}
}
算法五:归并排序
归并排序示意图
归并排序(Merge sort)是建立在归并操作上的一种有效的排序算法。该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。
算法步骤:
1. 申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列
2. 设定两个指针,最初位置分别为两个已经排序序列的起始位置
3. 比较两个指针所指向的元素,选择相对小的元素放入到合并空间,并移动指针到下一位置
4. 重复步骤3直到某一指针达到序列尾
5. 将另一序列剩下的所有元素直接复制到合并序列尾
详细介绍:归并排序
算法六:快速排序
快速排序示意图
快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο(n log n)次比较。在最坏状况下则需要Ο(n2)次比较,但这种状况并不常见。事实上,快速排序通常明显比其他Ο(n log n) 算法更快,因为它的内部循环(inner loop)可以在大部分的架构上很有效率地被实现出来。
快速排序使用分治法(Divide and conquer)策略来把一个串行(list)分为两个子串行(sub-lists)。
算法步骤:
1 从数列中挑出一个元素,称为 “基准”(pivot),
2 重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区退出之后,该基准就处于数列的中间位置。这个称为分区(partition)操作。
3 递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。
递归的最底部情形,是数列的大小是零或一,也就是永远都已经被排序好了。虽然一直递归下去,但是这个算法总会退出,因为在每次的迭代(iteration)中,它至少会把一个元素摆到它最后的位置去。
详细介绍:快速排序
public static int partition(int[] arr, int low, int high) {
int pivot = arr[high];
int i = low - 1;
int j, tmp;
for (j = low; j < high; ++j)
if (arr[j] < pivot) {
tmp = arr[++i];
arr[i] = arr[j];
arr[j] = tmp;
}
tmp = arr[i + 1];
arr[i + 1] = arr[high];
arr[high] = tmp;
return i + 1;
}
public static void quickSort(int[] a, int low, int high) {
if (low < high) {
int partiLoc = partition(a, low, high);
quickSort(a, low, partiLoc-1);
quickSort(a, partiLoc+1, high);
}
}
算法七:堆排序
堆排序示意图
堆排序(Heapsort)是指利用堆这种数据结构所设计的一种排序算法。堆积是一个近似完全二叉树的结构,并同时满足堆积的性质:即子结点的键值或索引总是小于(或者大于)它的父节点。
堆排序的平均时间复杂度为Ο(nlogn) 。
算法步骤:
1)创建一个堆H[0..n-1]
2)把堆首(最大值)和堆尾互换
3)把堆的尺寸缩小1,并调用shift_down(0),目的是把新的数组顶端数据调整到相应位置
4) 重复步骤2,直到堆的尺寸为1
详细介绍:堆排序
算法八:基数排序
基数排序是一种非比较型整数排序算法,其原理是将整数按位数切割成不同的数字,然后按每个位数分别比较。由于整数也可以表达字符串(比如名字或日期)和特定格式的浮点数,所以基数排序也不是只能使用于整数。
说基数排序之前,我们简单介绍桶排序:
算法思想:是将阵列分到有限数量的桶子里。每个桶子再个别排序(有可能再使用别的排序算法或是以递回方式继续使用桶排序进行排序)。桶排序是鸽巢排序的一种归纳结果。当要被排序的阵列内的数值是均匀分配的时候,桶排序使用线性时间(Θ(n))。但桶排序并不是 比较排序,他不受到 O(n log n) 下限的影响。
简单来说,就是把数据分组,放在一个个的桶中,然后对每个桶里面的在进行排序。
例如要对大小为[1..1000]范围内的n个整数A[1..n]排序
首先,可以把桶设为大小为10的范围,具体而言,设集合B[1]存储[1..10]的整数,集合B[2]存储 (10..20]的整数,……集合B[i]存储( (i-1)*10, i*10]的整数,i = 1,2,..100。总共有 100个桶。
然后,对A[1..n]从头到尾扫描一遍,把每个A[i]放入对应的桶B[j]中。 再对这100个桶中每个桶里的数字排序,这时可用冒泡,选择,乃至快排,一般来说任 何排序法都可以。
最后,依次输出每个桶里面的数字,且每个桶中的数字从小到大输出,这 样就得到所有数字排好序的一个序列了。
假设有n个数字,有m个桶,如果数字是平均分布的,则每个桶里面平均有n/m个数字。如果
对每个桶中的数字采用快速排序,那么整个算法的复杂度是
O(n + m * n/m*log(n/m)) = O(n + nlogn – nlogm)
从上式看出,当m接近n的时候,桶排序复杂度接近O(n)
当然,以上复杂度的计算是基于输入的n个数字是平均分布这个假设的。这个假设是很强的 ,实际应用中效果并没有这么好。如果所有的数字都落在同一个桶中,那就退化成一般的排序了。
前面说的几大排序算法 ,大部分时间复杂度都是O(n2),也有部分排序算法时间复杂度是O(nlogn)。而桶式排序却能实现O(n)的时间复杂度。但桶排序的缺点是:
1)首先是空间复杂度比较高,需要的额外开销大。排序有两个数组的空间开销,一个存放待排序数组,一个就是所谓的桶,比如待排序值是从0到m-1,那就需要m个桶,这个桶数组就要至少m个空间。
2)其次待排序的元素都要在一定的范围内等等。
总结
各种排序的稳定性,时间复杂度、空间复杂度、稳定性总结如下图:
关于时间复杂度:
(1)平方阶(O(n2))排序
各类简单排序:直接插入、直接选择和冒泡排序;
(2)线性对数阶(O(nlog2n))排序
快速排序、堆排序和归并排序;
(3)O(n1+§))排序,§是介于0和1之间的常数。
希尔排序
(4)线性阶(O(n))排序
基数排序,此外还有桶、箱排序。
关于稳定性:
稳定的排序算法:冒泡排序、插入排序、归并排序和基数排序
不是稳定的排序算法:选择排序、快速排序、希尔排序、堆排序
本文链接:http://www.cricode.com/3212.html
作者:快课网——Jay13 转载请务必保留作者出处,谢谢!