排序（上）：插入排序、冒泡排序和选择排序_插入排序冒泡排序选择排序需要的附加存储空间一样多-优快云博客

本文链接：https://blog.youkuaiyun.com/hyt1152860391/article/details/97751746

文章目录

小节

排序算法有很多，最经典的、最常用的：冒泡排序、选择排序、归并排序、快速排序、计数排序、基数排序、桶排序。按照时间复杂度把他们分成三类。
在这里插入图片描述

思考题：插入排序和冒泡排序的时间复杂度相同，都是O(n²)，在实际软件开发里，为什么我们更倾向于使用插入排序算法而不是冒泡排序算法呢？

如何分析一个“排序算法”

排序算法的执行效率

排序算法的执行效率，一般从这几个方面来衡量：

最好情况、最坏情况、平均情况时间复杂度
时间复杂度的系数、常数、低阶
比较次数和交换（或移动）次数

排序算法的内存消耗

算法的内存消耗通过空间复杂度来衡量，针对排序算法的空间复杂度，引入一个新的概念，原地排序（Sorted in place）。原地排序算法，特指空间复杂度是O(1)的排序算法。

排序算法的稳定性

稳定性，这个概念是说，如果待排序的序列中存在值相等的元素，经过排序之后，相等元素之间原有的先后顺序不变。

冒泡排序（Bubble Sort）

冒泡排序只会操作相邻的两个数据。每次冒泡操作都会对相邻的两个元素进行比较，看是否满足大小关系要求。如果不满足就让他两互换。一次冒泡会让至少一个元素移动到它应该在的位置，重复n次，就完成了n个数据的排序工作。

#include <stdio.h>
#include <stdlib.h>
#include "stdbool.h"

/*
@func： 从小到大排序
@param1： 数组
@param2： 数组大小
*/
void bubble_sort(int a[], int size)
{
    int i, j;
    int tmp;
    bool flag; // 用于标识是否还存在数据交换 0：没有可直接退出 1：有，继续比较
    if (size <= 1) {
        printf("Don't need to sort.\n");
        return;
    }
    /*未排序个数*/
    for (i = 0; i < size; i++) {
        flag = false;
        for(j = 0; j < size-i-1; j++) {
           if (a[j] > a[j+1]) {
               tmp = a[j];
               a[j] = a[j+1];
               a[j+1] = tmp;
               flag = true; //有数据交换
           }
           if (!flag)
               break; //没有数据交换。提前退出
        }
    }
    
    
}
int main()
{
    int a[10] = {10, 3, 4, 10, 32, 5, 6, 9, 17, 20};
    int len = sizeof(a)/sizeof(int);
    int i;
    bubble_sort(a, len);
    for (i = 0; i < len; i++) {
        printf("a[%d] ---> %d\n", i, a[i]);
    }
    return 0;
}

结合分析排序算法的三个方面，评估一下冒泡排序。

冒泡排序是原地排序算法吗 ？
冒泡排序的过程只涉及相邻数据的交换操作，空间复杂度为O(1),是一个原地排序算法。
冒泡排序是稳定排序算法吗？
当相邻两个元素的大小相等时，不做交换，相同大小数据排序前后顺序不会改变。
冒泡排序的时间复杂度是多少？

如何分析冒泡排序的平均时间复杂度？通过有序度和逆序度两个概念来进行分析。
有序度：数组中具有有序关系的元素对个数。一个完全有序的数组，比如1，2，3，4，5，6，有序度是n*(n-1)/2，也就是15。把完全有序的数组的有序度叫做满有序度。
逆序度：定义也有序度相反（默认从小到大为有序）。

逆序元素对：a[i] > a[j], 如果 i < j。

有一个公式可以表示他们之间的关系，逆序度 = 满有序度 - 有序度。排序的过程是一个增加有序度，减少逆序度的过程，最后达到满有序度的过程。

对于包含n个数据的数据进行冒泡排序，平均交换次数是多少？
最坏情况：初始有序度是0，要进行n*(n-1)/2次交换
最好情况：初始有序度为n*(n-1)/2, 不需要进行交换
取中间值n*(n-1)/4，来表示初始有序度既不是很高也不是很低的平均情况。所以平均情况下的时间复杂度就是O(n²)。

插入排序（Insertion Sort）

一个有序数组，往里面添加一个新的数据后，如何继续保持数据有序？我们只要遍历数组，找到数据应该插入的位置将其插入即可。

插入排序实现思路：将数组中的数据分为两个区间，已排序区间和未排序区间。初始已排序区间只有一个元素，就是数组的第一个元素。插入算法的核心思想是取未排序区间中的元素，在已排序区间中找到合适的位置将其插入，并保证已排序区间数据一直有序。重复这个过程，直到未排序区间中元素为空，算法结束。

#include <stdio.h>
#include <stdlib.h>
#include "stdbool.h"
/*
@func: 插入排序
*/
void insert_sort(int a[], int len)
{
    int i, j;
    int value;
    if (len <= 1) {
        printf("Don't need to sort.\n");
        return;
    }
    for (i = 1; i < len; i++) {
        value = a[i];
        j = i-1;
        /*查找插入的顺序*/
        for (; j >= 0; j--) {
            if(a[j] > value) {
                a[j+1] = a[j]; //数据移动
            } else {
                break;
            }
        }
        a[j+1] = value;
    }
}
int main()
{
    int i;
    int a[10] = {10, 3, 4, 10, 32, 5, 6, 9, 17, 20};
    int len = sizeof(a)/sizeof(int);
    insert_sort(a, len);
    for (i = 0; i < len; i++) {
        printf("a[%d] ---> %d\n", i, a[i]);
    }
    return 0;
}

插入排序分析

插入排序是原地排序算法吗？
插入排序不需要额外的存储空间，空间复杂度是O(1)，是一个原地排序算法。
插入排序是稳定的排序算法吗？
在插入排序中对于相同的元素，我们可以将后面出现的元素插入到前面出现的元素后面，不改变排序前后的顺序，所以插入排序是稳定的排序算法。
插入排序的时间复杂度是多少？
在数组中插入一个数据的平均时间复杂度是O(n)，对于插入排序来说，每次插入操作都相当于在数组中插入一个数据，循环执行n次插入操作，所以平均时间复杂度为O(n²)。

选择排序（Selection Sort）

选择排序的实现思路有点类似插入排序，也分已排序区间和未排序区间。选择排序每次会从未排序区中找到最小的元素，插入已排序区间的末尾。
在这里插入图片描述
选择排序算法分析：
选择排序空间复杂度为O(1)，是一种原地排序算法。选择排序的最好情况时间复杂度、最坏情况时间复杂度和平均情况时间复杂度都是O(n²)。选择排序不是一种稳定算法。

算法实现：

#include <stdio.h>
#include <stdlib.h>

void select_sort(int a[], int len)
{
    int i, j;
    int tmp, value, idx;
    if (len <= 1) {
        printf("Don't need to sort.\n");
        return;
    }
    
    for (i = 0; i < len; i++) {
        value = a[i];
        j = i;
        for ( ;j < len; j++) {
            if (a[i] > a[j]) {
                a[i] = a[j]; //找到最小值
                idx = j; //记录最小值的索引
            }
        }
        if (value == a[i]) //最小值就是本身不需要交换
            continue;
        //交换
        a[idx] = value;
    }
    return;
}
int main()
{
    int a [8] = {10, 10, 30, 73, 4, 1, 5, 2};
    int len = sizeof(a)/sizeof(int);
    int i;
    select_sort(a, len);
    for(i = 0; i < len; i++) {
        printf("a[%d] ---> %d\n", i, a[i]);
    }
}