排序算法

最新推荐文章于 2024-10-23 22:13:35 发布

转载最新推荐文章于 2024-10-23 22:13:35 发布 · 50 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：https://my.oschina.net/langwanghuangshifu/blog/2050213

2019独角兽企业重金招聘Python工程师标准>>>

排序有可以分为以下几类：

(1)、插入排序：直接插入排序、二分法插入排序、希尔排序。

(2)、选择排序：简单选择排序、堆排序。

(3)、交换排序：冒泡排序、快速排序。

(4)、归并排序

(5)、基数排序

一、插入排序

思想：每步将一个待排序的记录，按其顺序码大小插入到前面已经排序的字序列的合适位置，直到全部插入排序完为止。

关键问题：在前面已经排好序的序列中找到合适的插入位置。

方法：

–直接插入排序

–二分插入排序

–希尔排序

①直接插入排序（从后向前找到合适位置后插入）

1、基本思想：每步将一个待排序的记录，按其顺序码大小插入到前面已经排序的字序列的合适位置（从后向前找到合适位置后），直到全部插入排序完为止。

    public void insertSort(int[] a) {
        for (int i = 1; i < a.length; i++) {
            for (int j = i; j >= 1 && a[j - 1] > a[j]; j--) {
                swap(a, j, j - 1);
            }
        }
    }

    public void swap(int[] a, int i, int j) {
        int temp = a[i];
        a[i] = a[j];
        a[j] = temp;
    }

分析

直接插入排序是稳定的排序。

数组初始顺序不同时，直接插入排序所耗费的时间有很大差异。若数组初始顺序为正序，则每个待插入的记录只需要比较一次就能够找到合适的位置插入，故算法的时间复杂度为O(n)，这时最好的情况。若数组初始顺序为反序，则第i个待插入记录需要比较i+1次才能找到合适位置插入，故时间复杂度为O(n2)，这时最坏的情况。直接插入排序的平均时间复杂度为O(n2)。

②二分法插入排序（按二分法找到合适位置插入）

　　基本思想：二分法插入排序的思想和直接插入一样，只是找合适的插入位置的方式不同，这里是按二分法找到合适的位置，可以减少比较的次数。

③希尔排序

　　基本思想：先取一个小于n的整数d1作为第一个增量，把文件的全部记录分成d1个组。所有距离为d1的倍数的记录放在同一个组中。先在各组内进行直接插入排序；然后，取第二个增量d2<d1重复上述的分组和排序，直至所取的增量dt=1(dt<dt-l<…<d2<d1)，即所有记录放在同一组中进行直接插入排序为止。该方法实质上是一种分组插入方法。

    public void InsertSort(int[] a) {
        int len = a.length;
        int h = 1;
        while (h < len / 3) {
            h = 3 * h + 1;
        }
        while (h >= 1) {
            for (int i = h; i < len; i++) {
                for (int j = i; j >= h && a[j - h] > a[j]; j--) {
                    swap(a, j, j - h);
                }
            }
            h /= 3;
        }
    }

    public void swap(int[] a, int i, int j) {
        int temp = a[i];
        a[i] = a[j];
        a[j] = temp;
    }

分析

　　希尔排序是不稳定的。

　　希尔排序的时间性能优于直接插入排序，原因如下：

　　（1）当文件初态基本有序时直接插入排序所需的比较和移动次数均较少。

　　（2）当n值较小时，n和n^2的差别也较小，即直接插入排序的最好时间复杂度O(n)和最坏时间复杂度0(n^2)差别不大。

　　（3）在希尔排序开始时增量较大，分组较多，每组的记录数目少，故各组内直接插入较快，后来增量di逐渐缩小，分组数逐渐减少，而各组的记录数目逐渐增多，但由于已经按di-1作为距离排过序，使文件较接近于有序状态，所以新的一趟排序过程也较快。

　　因此，希尔排序在效率上较直接插人排序有较大的改进。

　　希尔排序的平均时间复杂度为O(nlogn)。

二、选择排序

思想：每趟从待排序的记录序列中选择关键字最小的记录放置到已排序表的最前位置，直到全部排完。

关键问题：在剩余的待排序记录序列中找到最小关键码记录。

方法：

–直接选择排序

–堆排序

①简单的选择排序

1、基本思想：在要排序的一组数中，选出最小的一个数与第一个位置的数交换；然后在剩下的数当中再找最小的与第二个位置的数交换，如此循环到倒数第二个数和最后一个数比较为止。

    public void sort(int[] a) {
        int length = a.length;
        for (int i = 0; i < length; i++) {
            int min = i;
            for (int j = i + 1; j < length; j++) {
                if (a[j] < a[min]) min = j;
            }
            swap(a, min, i);
        }
    }

    public void swap(int[] a, int i, int j) {
        int t = a[i];
        a[i] = a[j];
        a[j] = t;
    }

分析

　　简单选择排序是不稳定的排序。

　　时间复杂度：T(n)=O(n2)。

②堆排序

　　1、基本思想：

　　堆排序是一种树形选择排序，是对直接选择排序的有效改进。

　　堆的定义下：具有n个元素的序列（h1,h2,...,hn),当且仅当满足（hi>=h2i,hi>=2i+1）或（hi<=h2i,hi<=2i+1） (i=1,2,...,n/2)时称之为堆。在这里只讨论满足前者条件的堆。由堆的定义可以看出，堆顶元素（即第一个元素）必为最大项（大顶堆）。完全二叉树可以很直观地表示堆的结构。堆顶为根，其它为左子树、右子树。

　　思想:初始时把要排序的数的序列看作是一棵顺序存储的二叉树，调整它们的存储序，使之成为一个堆，这时堆的根节点的数最大。然后将根节点与堆的最后一个节点交换。然后对前面(n-1)个数重新调整使之成为堆。依此类推，直到只有两个节点的堆，并对它们作交换，最后得到有n个节点的有序序列。从算法描述来看，堆排序需要两个过程，一是建立堆，二是堆顶与堆的最后一个元素交换位置。所以堆排序有两个函数组成。一是建堆的渗透函数，二是反复调用渗透函数实现排序的函数。

public class HeapSort {
    public static void main(String[] args) {
        int[] data = new int[]{3, 2, 1, 4, 6, 5};
        heapSort(data);
        print(data);
    }

    public static void heapSort(int[] data) {
        int n = data.length;
        for (int i = 0; i < n; i++) {
            creatMaxHeap(data, n - 1 - i);
            swap(data, 0, n - 1 - i);
            print(data);
        }
    }

    /**
     * 创建最大二叉堆：使用自下而上的方法创建二叉堆的方法，分别对叶子结点的上一级节点以从上至下的方式重建堆。
     *
     * @param data
     * @param lastIndex
     */
    public static void creatMaxHeap(int[] data, int lastIndex) {
        for (int i = (lastIndex - 1) / 2; i >= 0; i--) {
            sink(data, i, lastIndex);
        }
    }

    /**
     * 当某一节点比其子节点要小的时候，就违反了二叉堆的定义，需要和其子节点进行交换以重新建堆，直到该节点都大于其子节点为止：
     *
     * @param data
     * @param i         父节点
     * @param lastIndex
     */
    public static void sink(int[] data, int i, int lastIndex) {
        while (2 * i + 1 <= lastIndex) {
            int childIndex = 2 * i + 1;
            //取左右子节点中，稍大的那个元素做比较
            if (childIndex < lastIndex) {
                if (data[childIndex] < data[childIndex + 1]) childIndex++;
            }
            //如果父节点比这个较大的元素还大，表示满足要求，退出
            if (data[i] > data[childIndex])
                break;
            //否则，与子节点进行交换
            swap(data, i, childIndex);
            i = childIndex; //自上而下重建堆
        }
    }

    public static void swap(int[] data, int i, int j) {
        int temp = data[i];
        data[i] = data[j];
        data[j] = temp;
    }

    public static void print(int[] data) {
        for (int i = 0; i < data.length; i++) {
            System.out.print(data[i] + "\t");
        }
        System.out.println();
    }
}

分析

堆排序也是一种不稳定的排序算法。

堆排序优于简单选择排序的原因：

直接选择排序中，为了从R[1..n]中选出关键字最小的记录，必须进行n-1次比较，然后在R[2..n]中选出关键字最小的记录，又需要做n-2次比较。事实上，后面的n-2次比较中，有许多比较可能在前面的n-1次比较中已经做过，但由于前一趟排序时未保留这些比较结果，所以后一趟排序时又重复执行了这些比较操作。

堆排序可通过树形结构保存部分比较结果，可减少比较次数。

堆排序的最坏时间复杂度为O(nlogn)。堆序的平均性能较接近于最坏性能。由于建初始堆所需的比较次数较多，所以堆排序不适宜于记录数较少的文件。

三、交换排序

①冒泡排序

　　1、基本思想：在要排序的一组数中，对当前还未排好序的范围内的全部数，自上而下对相邻的两个数依次进行比较和调整，让较大的数往下沉，较小的往上冒。即：每当两相邻的数比较后发现它们的排序与排序要求相反时，就将它们互换。

    public static void bubbleSort(int[] a) {
        boolean flag = true;
        for (int i = 0; i < a.length; i++) {
            flag = true;
            for (int j = 0; j < a.length - i - 1; j++) {
                if (a[j] > a[j + 1]) {
                    swap(a, j, j + 1);
                    flag = false;
                }
            }
            if (flag) {
                break;
            }
        }
    }

    public static void swap(int[] a, int i, int j) {
        int temp = a[i];
        a[i] = a[j];
        a[j] = temp;
    }

分析

冒泡排序是一种稳定的排序方法。　

若文件初状为正序，则一趟起泡就可完成排序，排序码的比较次数为n-1，且没有记录移动，时间复杂度是O(n)

若文件初态为逆序，则需要n-1趟起泡，每趟进行n-i次排序码的比较，且每次比较都移动三次，比较和移动次数均达到最大值∶O(n2)

起泡排序平均时间复杂度为O(n2)

②快速排序

1.基本思想：选择一个基准元素,通常选择第一个元素或者最后一个元素,通过一趟扫描，将待排序列分成两部分,一部分比基准元素小,一部分大于等于基准元素,此时基准元素在其排好序后的正确位置,然后再用同样的方法递归地排序划分的两部分。

    public static void quickSort(int[] a) {
        sort(a, 0, a.length - 1);
    }

    public static void sort(int[] a, int lo, int hi) {
        if (lo >= hi) return;
        int index = partition(a, lo, hi);
        if (index > lo) {
            sort(a, lo, index - 1);
        }
        if (index < hi) {
            sort(a, index + 1, hi);
        }
    }

    public static int partition(int[] a, int lo, int hi) {
        int i = lo;
        int j = hi + 1;
        while (true) {
            while (a[++i] < a[lo]) {
                if (i == hi) break;
            }
            while (a[--j] > a[lo]) {
                if (j == lo) break;
            }
            if (i >= j) {
                break;
            }
            swap(a, i, j);
        }
        swap(a, lo, j);
        return j;
    }
    
    public static void swap(int[] a, int i, int j) {
        int temp = a[i];
        a[i] = a[j];
        a[j] = temp;
    }

分析

快速排序是不稳定的排序。

快速排序的时间复杂度为O(nlogn)。

当n较大时使用快排比较好，当序列基本有序时用快排反而不好。

四、归并排序

1.基本思想:归并（Merge）排序法是将两个（或两个以上）有序表合并成一个新的有序表，即把待排序序列分为若干个子序列，每个子序列是有序的。然后再把有序子序列合并为整体有序序列。

自顶向下

public class Merge {
    public static void main(String[] args) {
        int[] a = {6, 2, 5, 4, 8, 1};
        sort(a);
        for (int i : a) {
            System.out.println(i);
        }
    }

    private static int[] aux;


    public static void sort(int[] a) {
        if (a == null || a.length == 0) {
            return;
        }
        aux = new int[a.length];
        sort(a, 0, a.length - 1);
    }


    public static void sort(int[] a, int lo, int hi) {
        if (lo >= hi) {
            return;
        }
        int mid = lo + (hi - lo) / 2;
        sort(a, lo, mid);
        sort(a, mid + 1, hi);
        merge(a, lo, mid, hi);
    }

    private static void merge(int[] a, int lo, int mid, int hi) {
        for (int i = lo; i <= hi; i++) {
            aux[i] = a[i];
        }
        int l = lo;
        int r = mid + 1;
        for (int i = lo; i <= hi; i++) {
            if (l > mid) {//左边排序完
                a[i] = aux[r++];
            } else if (r > hi) {//右边排序完
                a[i] = aux[l++];
            } else if (a[l] < a[r]) {
                a[i] = aux[l++];
            } else if (a[r] < a[l]) {
                a[i] = aux[r++];
            }
        }
    }
}

归并排序是稳定的排序方法。速度仅次于快速排序，为稳定排序算法，一般用于对总体无序，但是各子项相对有序的数列。归并排序的时间复杂度为O(nlogn)。

五、基数排序

1.基本思想：将所有待比较数值（正整数）统一为同样的数位长度，数位较短的数前面补零。然后，从最低位开始，依次进行一次排序。这样从最低位排序一直到最高位排序完成以后,数列就变成一个有序序列。

分析

基数排序是稳定的排序算法。基数排序的时间复杂度为O(d(n+r)),d为位数，r为基数。

转载于:https://my.oschina.net/langwanghuangshifu/blog/2050213