Sort —— 排序算法
插入排序:直接插入排序、希尔排序
选择排序:选择排序、堆排序
交换排序:冒泡排序、快速排序
归并排序:归并排序
直接插入排序
直接插入排序的基本思想是:把n个待排序的元素看成为一个有序表和一个无序表。开始时有序表中只包含1个元素,无序表中包含有n-1个元素,排序过程中每次从无序表中取出第一个元素,将它插入到有序表中的适当位置,使之成为新的有序表,重复n-1次可完成排序过程。
代码实现:
void InsertSort(int *a, size_t n)
{
for (int i = 0; i < n - 1 ; i++)
{
int end = i;
int tmp = a[end + 1];
while (end >=0)
{
if (a[end] > tmp)
{
a[end + 1] = a[end];
--end;
}
else
{
break;
}
}
a[end + 1] = tmp;
}
}
直接插入排序的时间复杂度和稳定性
直接插入排序的时间复杂度是O(N2):假设被排序的数列中有N个数,遍历一趟时间复杂度是O(N),需遍历多少次呢?N-1次,因此,其时间复杂度是O(N2)。
直接插入排序是稳定的算法,它满足稳定算法的定义:假设在数列中存在a[i]=a[j],若在排序之前,a[i]在a[j]前面;并且排序之后,a[i]仍然在a[j]前面。则这个排序算法是稳定的!
希尔排序
希尔排序是以它的发明者Donald Shell名字命名的,希尔排序是插入排序的改进版,实现简单,对于中等规模数据的性能表现还不错。
首先它把较大的数据集合分割成若干个小组(逻辑上分组),然后对每一个小组分别进行插入排序,此时,插入排序所作用的数据量比较小(每一个小组),插入的效率比较高。
代码实现:
void ShellSort(int *a, size_t n)
{
int gap = n;
while (gap > 1)
{
gap = gap / 3 + 1;
for (int i = 0; i < n - gap; i++)
{
int end = i;
int tmp = a[end + gap];
while (end >= 0 && a[end] > tmp)
{
a[end + gap] = a[end];
end -= gap;
}
a[end + gap] = tmp;
}
}
}
希尔排序的时间复杂度和稳定性
希尔排序的复杂度和gap是相关的
希尔排序不是稳定的,虽然插入排序是稳定的,但是希尔排序在插入的时候是跳跃性插入的,有可能破坏稳定性.
选择排序
选择排序是一种简单直观的排序算法。其基本思想是:首先在未排序的数列中找到最小(or最大)元素,然后将其存放到数列的起始位置;
接着,再从剩余未排序的元素中继续寻找最小(or最大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。
代码实现:
void SelectSort(int *a, int n)
{
int min, temp;
for (int i = 0; i < n - 1; i++)
{
min = i;
for (int j = i + 1; j < n; j++)
{
if (a[j] < a[min])
{
min = j;
}
}
if (min != i)
{
temp = a[min];
a[min] = a[i];
a[i] = temp;
}
}
}
选择排序的时间复杂度和稳定性
选择排序的时间复杂度是O(N2):假设被排序的数列中有N个数。遍历一趟的时间复杂度是O(N),需要遍历多少次呢?N-1次因此,选择排序的时间复杂度是O(N2)。
选择排序是稳定的算法,它满足稳定算法的定义:假设在数列中存在a[i]=a[j],若在排序之前,a[i]在a[j]前面;并且排序之后,a[i]仍然在a[j]前面。则这个排序算法是稳定的!
堆排序
堆排序就是利用堆进行排序的算法,它的基本思想是:将待排序的序列构造成一个大堆(或小堆)。此时,整个序列的最大值就是堆顶的根结点,将它移走(就是将其与堆数组的末尾元素交换,此时末尾元素就是最大值)。然后将剩余的n-1个序列重新构造成一个堆,这样就会得到n个元素中的最大值。如此反复进行,便能得一个有序的序列。
代码实现:
void AdjustDown(int* a, size_t n, int i)
{
int parent = i;
int child = parent * 2 + 1;
while (child < n)
{
if (child + 1 < n && a[child + 1] > a[child])
{
++child;
}
if (a[child] > a[parent])
{
swap(a[parent] , a[child]);
parent = child;
child = parent * 2 + 1;
}
else
{
break;
}
}
}
void HeapSort(int *a, size_t n)
{
for (int i = (n - 2) / 2; i >= 0; i--)
{
AdjustDown(a, n, i);
}
int end = n - 1;
while (end)
{
swap(a[0], a[end]);
AdjustDown(a, end, 0);
--end;
}
}
堆排序的时间复杂度和稳定性
堆排序的运行时间主要消耗在初始构建堆和在重建堆时,在构建堆的过程中,因为我们是完全二叉树从最下层最右边的非叶子节点开始构建,将它与其孩子进行比较,判断是否有必要交换,对于非叶子节点来说,最多进行两次比较和互换工作,因此整个构建堆的时间复杂度为O(n)。
在开始排序时,重建堆的时间复杂度为O(nlogn),所以总体来说,堆排序的时间复杂度为O(logn).
冒泡排序
冒泡排序(Bubble Sort),又被称为气泡排序或泡沫排序。
它是一种较简单的排序算法。它会遍历若干次要排序的数列,每次遍历时,它都会从前往后依次的比较相邻两个数的大小;如果前者比后者大,则交换它们的位置。这样,一次遍历之后,最大的元素就在数列的末尾! 采用相同的方法再次遍历时,第二大的元素就被排列在最大元素之前。重复此操作,直到整个数列都有序为止!
代码实现:
void BubbleSort(int *a, size_t n)
{
for (size_t i = 0; i < n; i++)
{
int flag = 0; //初始化标记为0
for (size_t j = 0; j < n - i - 1; j++) //将a[0. . . i]中的最大数放在末尾
{
if (a[j] > a[j + 1])
{
//swap(a[j], a[j + 1]);//交换a[j]和a[j+1]
int temp = a[j];
a[j] = a[j + 1];
a[j + 1] = temp;
flag = 1; //若发生交换,则把标记置为1
}
}
if (flag == 0) //若没发生交换,则说明数组已经有序
{
break;
}
}
}
冒泡排序的时间复杂度和稳定性
冒泡排序的时间复杂度是O(N2)。假设被排序的数列中有N个数。遍历一趟的时间复杂度是O(N),需要遍历多少次呢?N-1次!因此,冒泡排序的时间复杂度是O(N2)。
冒泡排序是稳定的算法,它满足稳定算法的定义。
快速排序
快速排序使用分治法策略。它的基本思想是:选择一个基准数,通过一趟排序将要排序的数据分割成独立的两部分;其中一部分的所有数据都比另外一部分的所有数据都要小。然后,再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。
快速排序流程如下:
-
从数列中挑出一个基准值。
-
将所有比基准值小的摆放在基准前面,所有比基准值大的摆在基准的后面(相同的数可以到任一边);在这个分区退出之后,该基准就处于数列的中间位置。
-
递归地把"基准值前面的子数列"和"基准值后面的子数列"进行排序。
三种方法:
-
左右指针法
-
挖坑法
-
前后指针法
//左右指针法
int partSort1(int * a, int begin, int end)
{
int left = begin;
int right = end;
int key = a[right];
while (begin < end)
{
//begin找大
while (begin < end && a[begin] <= key)
{
++begin;
}
//end找小
while (begin < end && a[end] >= key)
{
--end;
}
swap(a[begin], a[end]);
}
swap(a[begin], a[right]);
return begin;
}
void QuickSort(int* a, int left, int right)
{
if (left >= right)
return;
int div = partSort1(a, left, right);
QuickSort(a, left, div - 1);
QuickSort(a, div + 1, right);
}
//挖坑法
int partSort2(int *a, int begin, int end)
{
int key = a[end];
while (begin < end)
{
while (begin < end && a[begin] <= key)
{
++begin;
}
a[end] = a[begin];
while (begin < end && a[end] >= key)
{
--end;
}
a[begin] = a[end];
}
a[begin] = key;
return begin;
}
void QuickSort(int* a, int left, int right)
{
if (left >= right)
return;
int div = partSort2(a, left, right);
QuickSort(a, left, div - 1);
QuickSort(a, div + 1, right);
}
//前后指针法
int partSort3(int *a, int begin, int end)
{
int key = a[end];
int prev = begin - 1;
int cur = begin;
while (cur < end)
{
if (a[cur] < key && ++prev != cur)
{
swap(a[prev], a[cur]);
}
++cur;
}
swap(a[++prev], a[end]);
return prev;
}
void QuickSort(int* a, int left, int right)
{
if (left >= right)
return;
int div = partSort3(a, left, right);
QuickSort(a, left, div - 1);
QuickSort(a, div + 1, right);
}
快排优化
-
三数取中法
-
尾递归
当插入的数小于等于常数时用直接插入排序,在这里我们一般设置为小于等于7。
三数取中法:
排序速度的快慢取决于关键字key处在整个序列的位置,key太小或太大都会影响性能,改进方法就是三数取中法,取三个关键字先进行排序,将中间的数作为key,一般取左端、右端和中间三个数,也可以随机选取。
//三数取中法
#define MAX_LENGTH_INSERT_SORT 7
void _InsertSort(int *a, size_t n)
{
for (size_t i = 0; i < n - 1; i++)
{
int end = i;
int tmp = a[end + 1];
while (end >= 0)
{
if (a[end] > tmp)
{
a[end + 1] = a[end];
--end;
}
else
{
break;
}
}
a[end + 1] = tmp;
}
}
void InsertSort(int *a, int left, int right)
{
_InsertSort(a + left, right - left + 1);
}
int partSort2(int *a, int begin, int end)
{
int mid = begin + (end - begin) / 2;
if (a[end] > a[begin])
{
swap(a[begin], a[end]);
}
if (a[mid] > a[begin])
{
swap(a[mid], a[begin]);
}
if (a[mid] > a[end])
{
swap(a[mid], a[end]);
}
int key = a[end];
while (begin < end)
{
while (begin < end && a[begin] <= key)
{
++begin;
}
a[end] = a[begin];
while (begin < end && a[end] >= key)
{
--end;
}
a[begin] = a[end];
}
a[begin] = key;
return begin;
}
void QuickSort(int* a, int left, int right)
{
if ((right - left) > MAX_LENGTH_INSERT_SORT)
{
int div = partSort2(a, left, right);
QuickSort(a, left, div - 1);
QuickSort(a, div + 1, right);
}
else //当 right - left 小于等于常数时用直接插入排序
{
InsertSort(a, left, right);
}
}
尾递归:
递归对性能是有一定影响的,partSort函数在其尾部有两次递归操作。如果带排序的序列划分极端的不平衡,递归深度将趋近于n,而不是平衡时的logn。栈的大小是很有限的,每次调用都会耗费一定的栈空间,函数的参数越多,每次递归耗费的空间也就越多,因此如果能减少递归,将会大大提高性能。
//尾递归
#define MAX_LENGTH_INSERT_SORT 7 //数组长度阈值
void _InsertSort(int *a, size_t n)
{
for (size_t i = 0; i < n - 1; i++)
{
int end = i;
int tmp = a[end + 1];
while (end >= 0)
{
if (a[end] > tmp)
{
a[end + 1] = a[end];
--end;
}
else
{
break;
}
}
a[end + 1] = tmp;
}
}
void InsertSort(int *a, int left, int right)
{
_InsertSort(a + left, right - left + 1);
}
int partSort2(int *a, int begin, int end)
{
int mid = begin + (end - begin) / 2;
if (a[end] > a[begin])
{
swap(a[begin], a[end]);
}
if (a[mid] > a[begin])
{
swap(a[mid], a[begin]);
}
if (a[mid] > a[end])
{
swap(a[mid], a[end]);
}
int key = a[end];
while (begin < end)
{
while (begin < end && a[begin] <= key)
{
++begin;
}
a[end] = a[begin];
while (begin < end && a[end] >= key)
{
--end;
}
a[begin] = a[end];
}
a[begin] = key;
return begin;
}
void QuickSort(int* a, int left, int right)
{
if ((right - left) > MAX_LENGTH_INSERT_SORT)
{
while (left < right)
{
int div = partSort2(a, left, right);
if (div - left < right - div)
{
QuickSort(a, left, div - 1);
left = div + 1;
}
else
{
QuickSort(a, div + 1, right);
right = div - 1; //尾递归
}
}
}
else
{
InsertSort(a, left, right);
}
}
快速排序的时间复杂度和稳定性
快速排序的时间复杂度:快速排序的时间复杂度在最坏情况下是O(N2),平均的时间复杂度是O(N*lgN)。这句话很好理解:假设被排序的数列中有N个数。遍历一次的时间复杂度是O(N),需要遍历多少次呢?至少lg(N+1)次,最多N次。
为什么最少是lg(N+1)次?快速排序是采用的分治法进行遍历的,我们将它看作一棵二叉树,它需要遍历的次数就是二叉树的深度,而根据完全二叉树的定义,它的深度至少是lg(N+1)。因此,快速排序的遍历次数最少是lg(N+1)次。
为什么最多是N次?还是将快速排序看作一棵二叉树,它的深度最大是N。因此,快速排序的遍历次数最多是N次。
快速排序的稳定性:快速排序是不稳定的算法,它不满足稳定算法的定义。
归并排序
归并排序就是利用归并的思想实现的排序方法。它的原理是假设初始序列有n个记录,则可以看成是n个有序的子序列,每个子序列的长度为1或2,然后两两归并,得到[n/2]个长度为2 或1的有序子序列,再两两归并,.......,如此重复,直至得到一个长度为n的有序序列为止。这种方法称为2路归并排序。
//归并排序 递归实现
void MergeSort(int *a, size_t n)
{
int * tmp = new int[n];
_MergeSort(a, 0, n - 1, tmp);
delete[] tmp;
}
void _MergeSort(int *a, int left, int right, int *tmp)
{
if (left >= right)
return;
int mid = left + ((right - left) >> 1);
//[left, mid] [mid+1, right]
//保证两段子区间有序,再归并
_MergeSort(a, left, mid, tmp);
_MergeSort(a, mid + 1, right, tmp);
//归并
int begin1 = left, end1 = mid;
int begin2 = mid + 1, end2 = right;
int index = left;
while (begin1 <= end1 && begin2 <= end2)
{
if (a[begin1] < a[begin2])
{
tmp[index++] = a[begin1++];
}
else
{
tmp[index++] = a[begin2++];
}
}
while (begin1 <= end1)
{
tmp[index++] = a[begin1++];
}
while (begin2 <= end2)
{
tmp[index++] = a[begin2++];
}
index = left;
while (index <= right)
{
a[index] = tmp[index];
++index;
}
}
归并排序的时间复杂度和稳定性
归并排序总的时间复杂度O(nlogn),这是归并排序算法中最好、最坏、平均的时间性能。
归并排序是一种比较占用内存,但却效率高且稳定的算法。