应用:假设一个乱序数组,需要查找一个元素是否在该数组中,这时需要用到顺序查找,也就是遍历数组。
一般情况下我们会写下如下代码:
- int Sequential_Search(int *a,int n,int key)
- {
- //数组从1开始
- int i;
- for(int i=1;i<=n;i++)
- {
- if(a[i]==key)
- return i;
- }
- return 0;//查找失败
- }
有的数据结构书上,会运用哨兵元素,改成这样的代码:
- int Sequential_Search2(int *a int n,int key)
- {
- int i=0;
- a[0]=key;//哨兵
- i=n;
- while(a[i]!=key)
- {
- i--;
- }
- return i;//返回0就是查找失败
- }
仔细看来没有什么差别,但是来看下我测试的运行时间,数组有10亿个元素。
方案1:3.494s 3.202s 3.216s 3.237s
方案2:2.332s 2.307s 2.24s 2.194s
为什么基本一样的代码,方案2比方案1性能提升了30%~40%左右???
循环中,方案1有3条指令而方案2有两条指令,少了i<n这个比较操作,所以方案2性能得到了提升,这也是哨兵元素的妙用
以上思想和代码来自于《大话数据结构》中的296页。
大话数据结构的原文“这种查找方法在查找方向的尽头设置哨兵元素,免去了查找过程中每次比较后都要判断查找位置是否越界的小技巧,看似与原先差别不大,但是总数据较多时,效率提高很明显,是非常好的编程技巧。当然,“哨兵”也不一定在数组开始,也可以再末尾”
测试代码如下:
#include <time.h>
void main()
{
int num=1000000000;
char *p=new char[num];
p[0]=2;
char key=p[0];
clock_t start, finish1,finish2;
double time1,time2;
start=clock();
for(int i=1;i<num;i++)
{
if(p[i]==key)
break;
}
finish1=clock();
int i=num-1;
while(p[i]!=key)
{
i--;
}
finish2=clock();
time1=(double)(finish1-start)/CLOCKS_PER_SEC; //不使用哨兵查找用的时间
time2=(double)(finish2-finish1)/CLOCKS_PER_SEC; //使用哨兵查找用的时间
cout<<time1<<endl;
cout<<time2<<endl;
}
下面是《编程珠玑》第九章的一道习题:如何在程序中使用哨兵来找出数组中的最大元素
如何在程序中使用哨兵来找出数组中最大的元素(在x[0...n-1]找出最大的元素)
下面代码中,使用x[n]作为哨兵。
i=0;
while(i<n)
{
max=x[i];
x[n]=max;
i++;
while(x[i]<max)
i++;
}