第十一章排序

最新推荐文章于 2024-10-29 21:05:29 发布

原创最新推荐文章于 2024-10-29 21:05:29 发布 · 816 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#random #ini #算法 #c #numbers #basic

编程珠玑专栏收录该内容

15 篇文章

订阅专栏

如何将一系列的记录排成有序的？答案通常很简单：使用库函数排序。

本节介绍几个排序方法，以及部分方法的改进措施，并作出相应的实验来验证。

1.插入排序

为了将数组x[n]按升序排列，我们首先将第一个元素视为有序子数组x[0..0]，然后插入x[1],...,x[n-1]，如下面的伪代码所示：

for i=[1,n)
    /* invariant: x[0..i-1] is sorted */
    /* goal: sift x[i] down to its proper
             place in x[0..i] */

代码中isort1()为基本的插入排序代码，isort2()在1的基础上进行改进--将isort1()中的swap()函数展开内联写入内循环。isort3()将赋值语句移出内循环以达到最后只需一次赋值的效果。

2.快速排序

快速排序用到了第八章中的分治法：排序数组时，将数组分成两个小部分，然后对它们递归排序。

下面分别用下标l和u表示数组待排序不分的下界和上界，递归结束的条件是待排序部分的元素个数小于2。代码如下：

void qsort(l, u)
    if l>=u then
         /* at most one element, do nothing */
         return
    /* goal: partition array around a particular value,
       which is eventually placed in its correct position p */
    qsort(l, p-1)
    qsort(p+1, u)

下面围绕值t=x[l]划分数组x[l..u]，划分的循环不变式为：

代码中qsort1()为简单的快速排序算法，当输入数组是不同元素的随机排列时，该快速排序平均需要O(nlogn)的时间和O(logn)的栈空间。任何基于比较的排序至少需要O(nlogn)次比较，因此快速排序接近最优算法。伪代码如下：

void qsort1(l, u)
     if(l>=u)
        return
     m=l
     for i=[l+1, u]
        /* invariant: x[l+1..m] < x[l] && x[m+1..i-1] >= x[l] */
        if(x[i]<x[l])
           swap(++m, i)
     swap(l, m)
     qsort1(l, m-1)
     qsort1(m+1, u)

但是在非随机输入上它的性能存在问题。考虑一种极端的情况：n个相同元素组成的数组。对于这种输入，插入排序的性能很好：每个元素需要移动的距离都为0，总的运行时间为O(n)；但qsort1()函数性能却很低。n-1次划分中每次划分都需要O(n)时间来去掉一个元素，所以总的运行时间为O(n^2)。因为每次划分结束后m值都在未排序序列的最左端，导致在接下来的两小部分递归中左半部分长度为0，所以m是遍历地像序列右方推进，导致不能达到对数logn的划分效果，所以最后n个元素的n-1次划分花费了O(n^2)的时间复杂度。qsort2()对这种情况进行了改进，采用双向划分的策略，循环不变式为：

当所有元素都相同时，做法为当遇到相同的元素时停止扫描，并交换i和j的值。这样做虽然使交换的次数增加了，但却将所有元素都相同的最坏情况变成了差不多需要nlogn次比较的最好情况。因为在这种情况下，划分的m会在数组的中间部分出现，故可以达到logn的效果。伪代码如下：

void qsort3(l, u)
     if l>=u
        return
     t=x[l]; i=l; j=u+1
     loop
        do i++ while i<=u && x[i]<t
        do j-- while x[j]>t
        if i>j
            break;
        swap(i, j)
     swap(l, j)
     qsort3(l, j-1)
     qsort3(j+1, u)

对快速排序的进一步改进qsort3()主要改进了算法的两个方面：1，到目前为止快速排序都是围绕数组的第一个元素进行划分的，随机选择划分就可以得到好得多的性能，我们通过把x[l]与x[l..u]中的一个随机项相交换来实现这一点：swap(l, randint(l, u))。2，因为对于大规模的数据来说快速排序的递归层次可能很高，导致堆栈溢出或存储计算开销过大的情况，所以如果用插入排序之类的简单方法来排序小数组，程序的速度会更快。当在小的子数组上调用快速排序时(l和u非常接近)，不执行任何操作，将qsort3中的第一个if语句改为：if u-l<cutoff return，其中cutoff是一个小整数。

以下为一些算法上的说明：

1.对于随机数产生，rand()是让每次产生的数都不一样，但是重复执行程序若输入参数与上次相同则产生的数一样，所以为伪随机数。若加上函数srand()为rand()设置种子则rand()每次产生的数不同且重复执行(参数相同情况下)产生的数也不一样。

2.希尔排序就是更广义的插入排序，只不过比较的步长不是1而是一个gap值。

3.selectsort()为选择排序即冒泡排序。

4.注意快速排序的边界条件。

5.注意，堆使用的是下标从1开始的数组，C语言中最简单的方法就是声明x[n+1]并浪费元素x[0]。在程序中设定新的指针int *x=realx，以使x可以移动来适应堆排序。因为要设立升序序列所以建立大顶堆。在编写siftdown()函数时注意设立边界参数以适应对函数的调用。

6.在timedriver()中灵活地编写计时程序和错误检测程序。

下面为代码部分：

#include <stdio.h>
#include <stdlib.h>
#include <time.h>

#define MAXN 10000000

//#include <algorithm>
//using namespace std;


int realx[MAXN];
int n;
int *x=realx; // allow x to shift for heaps 

// generate random number between l and u
int randint(int l, int u)
{
    //return (RAND_MAX()%(u-l)+l);
    return l+(RAND_MAX*rand()+rand())%(u-l+1);
}

/*
int swap(int i, int j)
{
    int temp;
    temp=i; i=j; j=temp;
    
    return 0;
}
*/

int swap(int i, int j)
{
    int t;
    t=x[i];
    x[i]=x[j];
    x[j]=t;
    
    return 0;
}


// INSERTION SORT
// simplest insertion sort
int isort1()
{
    int i, j;
    for(i=1;i<n;i++)
    {
                    for(j=i;j>0&&x[j-1]>x[j];j--)
                        //swap(x[j], x[j-1]);
                        swap(j,j-1);
    }
    
    return 0;
}
// write swap function inline 
int isort2()
{
    int i, j, temp;
    for(i=1;i<n;i++)
    {
                    for(j=i;j>0&&x[j-1]>x[j];j--)
                    {
                        temp=x[j];
                        x[j]=x[j-1];
                        x[j-1]=temp;                             
                    }
    }
    
    return 0;
}
// do swap at last
int isort3()
{
    int i, j, t;
    for(i=1;i<n;i++)
    {
                    t=x[i];
                    for(j=i;j>0&&x[j-1]>t;j--)
                        x[j]=x[j-1];
                    x[j]=t;
    }
    
    return 0;
}

// SHELL SORT
// The basic 
int shellsort() 
{
    int i, j, gap, temp;
    for(gap=n/2;gap>0;gap/=2)
    {
                             for(i=gap;i<n;i++)   //
                             {
                                               //for(j=i;j>0&&x[j-gap]>x[j];j-=gap)  j must be bigger or equal to gap
                                               for(j=i;j>=gap&&x[j-gap]>x[j];j-=gap)
                                               {
                                                        temp=x[j];
                                                        x[j]=x[j-gap];
                                                        x[j-gap]=temp;
                                               }
                             }
    }
    
    return 0;
}

// SELECTION SORT
int selectsort()
{
    int i, j;
    for(i=1;i<n;i++)
    {
                      //for(j=n-1;j>=0;j--)  the numbers in front are already in order
                      for(j=n-1;j>=i;j--)
                      {
                                         if(x[j]<x[j-1])
                                             swap(j,j-1);
                      }
    }
    
    return 0;
} 

// QUICK SORT
// simplest version  l=0 u=n-1
int qsort1(int l, int u)
{
    int i, m;
    if(l>=u)
        return 0;
    m=l;
    //for(i=l;i<u;i++)  // the ending condition
    //for(i=l;i<=u;i++)
    for(i=l+1;i<=u;i++)  // x[l]作为哨兵(sentinel)，从x[l+1]开始比较 
    {
                    if(x[i]<x[l])
                       swap(++m, i);
    }
    swap(l,m);
    qsort1(l,m-1);
    qsort1(m+1,u);
    
    return 0;
}

// Two-way partitioning  
int qsort2(int l, int u)
{
    /*
    int i, j, t, m;
    if(l>=u)
        return 0;
    m=l;
    i=l;
    j=u;
    while(i<j)
    {
              //while(x[i]<x[l]) i++;
              while(x[j]>x[l]) j--;
              swap(x[i], x[j]);
              i++;
              j--;
    }
    if(i==j)
    {
            if(x[i]>x[l])
                m=i-1;
            else 
                m=i;
    }
    else
    m=i-1;
    swap(x[l],x[m]);
    qsort2(l,m-1);
    qsort2(m+1,u);
    */
    int i, j, t;
    if(l>=u)
        return 0;
    t=x[l];
    i=l;
    j=u+1;
    for(;;)
    {
           do i++; while(i<=u&&x[i]<t); // i<=u
           do j--; while(x[j]>t);
           if(i>j) // stop condition
               break;
           swap(i,j);    
    }
    swap(l,j);
    qsort2(l,j-1);
    qsort2(j+1,u);
    
    return 0;
}

// qsort2 + randomization + isort small subarrays + swap inline
int cutoff=50;
int qsort3(int l, int u)
{
    int i, j, t, temp;
    if(l>=u)
        return 0;
    if(u-l<cutoff)
        return 0;
    //int cutoff=50;  // set
    /*
    int random;
    random=randint(l, u);
    swap(x[l],x[random]);
    */
    swap(l,randint(l,u));
    t=x[l];
    i=l;
    j=u+1;
    for(;;)
    {
           do i++; while(i<=u&&x[i]<t);
           do j--; while(x[j]>t);
           if(i>j) // stop condition
               break;
           temp=x[i];
           x[i]=x[j];
           x[j]=temp;   
    }
    swap(l,j);
    qsort2(l,j-1);
    qsort2(j+1,u);
    
    return 0;
}

// 编写程序，在O(n)时间内从数组x[0..n-1]中找出第k个最小的元素。算法可以对x中的元素进行排序。 
int select(int l, int u, int k)
{
    swap(l,randint(l,u));
    int i, j, t, temp;
    t=x[l];
    i=l;
    j=u+1;
    for(;;)
    {
           do i++; while(i<=u&&x[i]<t);
           do j--; while(x[j]>t);
           if(i>j) // stop condition
               break;
           temp=x[i];
           x[i]=x[j];
           x[j]=temp;   
    }
    swap(l,j);
    if(j>k)
        select(l, j-1, k);
    else if(j<k)
        select(j+1, u, k);
    
    return 0;
}

// HEAP SORT 
/* 
int heapsort()
{
    int i;
    for(i=1;i<n;i++)
        siftup(i);
    for(i=0;i<n;i++)
    {
                    swap(x[i],x[n-1-i]);
                    siftdown()
    }
    
    return 0;
}
*/
// 由小到大的顺序 
int heapsort1()
{	
    int i;
	x--;
	for(i=2;i<=n;i++)
		siftup1(i);
	for(i=n;i>=2;i--)
    {
                     swap(1,i);
                     siftdown1(1,i-1);
    }    
	x++;
	
	return 0;
}

int heapsort2()
{	
    int i, m=n;
	x--;
	for(i=2;i<=n;i++)
		siftup2(i);
	/*
    for(i=n;i>=2;i--)
    {
                     swap(1,i);
                     siftdown1(1,i-1);
    }
    */
    
    for(i=1;i<n;i++)
    {
                       swap(1,m);
                       m=n-i;
                       siftdown2(1,m);
    }
        
	x++;
	
	return 0;
}


int siftup2(int a)
{
    //if(a<1)
    if(a==1)
        return 0;
    //int t=x[a];
    int b=a/2;
    if(x[a]>=x[b])
    {
              swap(a,b);
              siftup2(b);
    }    
    else 
        return 0;
}

// 调整成大顶堆 
int siftup1(int u)
{
    int i;
    for(;;)
    {
           /*
           i=u/2;
           if(i==1)
               break;
           */
           if(u==1)
               break;
           i=u/2;
           //if(x[i]<x[u])
           //if(x[i]<=x[u])    
           if(x[i]>=x[u])    
               break;
           swap(i,u);
           u=i;
    }
    
    return 0;
}

int siftdown2(int a, int m)
{
    if(a>m/2)
        return 0;
    int c=a*2;
    if(c+1<=m&&x[c]<=x[c+1])//  c+1<=m
        c++;
    if(x[a]<=x[c])
    {
                 swap(a,c);
                 siftdown2(c,m);
    }
    else 
        return 0;
}

// 调整成大顶堆 
int siftdown1(int l, int u)
{
    int i, c;
    i=l;
    for(;;)
    {
           c=2*i;
           if(c>u)
               break;
           //if()
           if(c+1<=u&&x[c+1]>x[c])
               c++;
           if(x[i]>x[c])
               break;
           swap(i,c);
           i=c;
    }
    
    return 0;
}

int intcomp(const void *x, const void *y)
{
    return *(int *)x-*(int *)y;
}


int timedriver()
{
    int algnum, maxv, i, starttime, k, clicks;
    //srand((unsigned)time(NULL));
    while(scanf("%d %d %d",&algnum, &n, &maxv)!=EOF)
    {
                    for(i=0;i<n;i++)
                        x[i]=randint(0, maxv-1);
                    k=n/2;
                    starttime=clock();
                    switch(algnum)  // switch-case
                    {
                           case 11: qsort(x, n, sizeof(int), intcomp); break;
		                   //case 12: sort(x, x+n); break;
		                   case 21: isort1(); break;
		                   case 22: isort2(); break;
		                   case 23: isort3(); break;
		                   case 31: qsort1(0, n-1); break;
		                   case 32: qsort2(0, n-1); break;
		                   case 33: qsort3(0, n-1); isort3();break;
		                   case 41: select(0, n-1, k); break;
		                   case 51: heapsort1(); break;
		                   case 52: heapsort2(); break;
                           case 61: shellsort(); break;
		                   case 62: selectsort(); break;
                    }
                    clicks=clock()-starttime;
                    if(algnum==41)       // test selection 
                    {
                           for(i=0;i<k;i++)
                                 if(x[i]>x[k])
	                                  printf("  SELECT BUG i=%d\n", i);
                           for(i=k+1;i<n;i++)
                                 if(x[i]< x[k])
                                      printf("  SELECT BUG i=%d\n", i);
                    }
                    else     // test sort   
                    {
                           for(i=0;i<n-1;i++)
				                if(x[i]>x[i+1])
					               printf("  SORT BUG i=%d\n", i);
                    }
                    printf("%d\t%d\t%d\t%d\t%g\n",algnum, n, maxv, clicks, 1e9*clicks/(CLOCKS_PER_SEC*n));
    }

    return 0;               
}

// main
int main()
{
    timedriver();
    return 0;
}

程序的运行结果截图：