二分查找的几点思考

本文深入探讨二分查找算法,不仅介绍基本实现,还探讨如何找到目标值的首个和末个出现位置,以及如何利用二分查找解决实际问题,如求序列中特定值的边界。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

原文:http://blog.youkuaiyun.com/hexinuaa/article/details/6600885



二分查找的几点思考

很早听说90%的程序员写不出正确的二分查找程序,对此颇为怀疑也颇为惶恐。怀疑的是,二分查找真的很难写吗?惶恐的是,怀疑的我能否在短时间内写出一个正确的二分查找程序?为了自己能成为10%中的一员,在此特别总结了二分查找算法。

二分查找又称折半查找,用于在有序序列中快速寻找一个值。它始终维护一个子序列[low, high],这个子序列可能包含目标值v。初始,这个子序列是整个序列[0, size-1], 每次取序列的中间值A[mid](其中,mid = low + (high-low)/2)与目标值v比较,因为序列是有序的,所以,每次都可以根据比较结果, 抛弃一半的序列。递归这个过程,直到找到目标值v或序列为空。

二分查找可以用递归实现,人们一般把二分查找写成非递归的。

程序1.1

int binary_search(int A[], int size,int v)

{

    int mid, low, high;

    low = 0; high = size - 1;

    while (low <= high) {

       mid = low + (high-low)/2; ①    //avoid overflow

       if(A[mid] == v)

           return mid;

       elseif(A[mid] < v)

           low = mid+1;

       else

           high = mid-1;

    }

    return -1;

}

上述程序无需多解释了,①处没有写成mid = (low+high)/2;是为了避免整数溢出,当low和high较大时,low和high本身没有溢出,而low+high有可能溢出。

下面提一个有趣的问题:如果数组中有多个元素都是v,上面的函数返回的是哪一个的下标呢?第一个?最后一个?都不是。有时,我们想确定数组A[0…size-1]中v第一次出现的位置。那应该如何编写程序呢?

程序1.2

int binary_search_lb(int A[], int size,int v)

{

    int mid, low, high;

    low = 0; high = size - 1;

    while(low < high) {

       mid = low + (high-low)/2;

       if(A[mid] >= v) high = mid; ①

       else   low = mid + 1;    ②

    }

    //确认是否存在v

    if(A[low] == v) return low;

    elsereturn -1;

}

A[mid]和v的各种关系所带来的影响如下:

A[mid]=v : 至少已经找到一个,而左边可能还有,因此区间[low, mid];

A[mid]>v : 所求位置不可能在后面,本应该让high = mid-1;但是,令区间为[low, mid]也是没有问题的;

A[mid]<v : m和前面都不可行,因此区间变为[m+1, high]

while(low < high), 都与之前的二分查处程序不一样了。当只有一个元素(low=high)的时候,退出循环,最后仍要判断A[low]是否为v,有的话low就是等v的最小下标,没有的话返回-1; 

其实,二分查找不仅可以用来查找某个元素的存在,通常还用来寻找解空间中满足某个条件的下界。这个条件或者说断言p,通常具有如下性质:

若 p(x)成立,对于所有的y>x, p(y)都成立。当然,若p(x) 不成立,所有y < x, p(y)都不成立。

就拿上个例子为例,换个说法就是,给定有序数组A[0…size-1],寻找首个满足>=v条件的元素下标。因为数组是有序的,当某个元素值A[i]>=v时,后续的所有元素都满足>=v的条件。

假设数组A如下:

0

5

13

19

22

41

55

68

72

81

98

解空间就是下标的集合:

0

1

2

3

4

5

6

7

8

9

10

目标值v= 55时, 断言的满足情况如下:

no

no

no

no

no

no

yes

yes

yes

yes

yes

我们如何写二分查找程序,寻找第一个yes所在的下标呢?程序和上面的是类似的。

如果没有yes存在,通常,我们返回一个不存在的标志。但这里,我们假想A[size]这个哨兵一定是满足条件的,可以把它看成是个无穷大的数,它一定大于v,当没有元素大于等于v时,我们返回size。程序如下:

程序1.3

int binary_search_lb(int A[], int size,int v)

{

    int mid, low, high;

    low = 0; high = size;

    while(low < high) {

       mid = low + (high-low)/2;

       if(A[mid] >= v) high = mid; ①

       else   low = mid + 1;    ②

    }

    return low;

}

寻找第一个yes,更通用的程序架构如下:

程序1.4

binary_search(low, high, p):

   while low < high

          mid = low + (high-low)/2

          if p(mid) == true:

                high = mid

          else:

                low = mid+1

   if p(low) == false:

           complain                // p(x) is false for all x in S!

    return low         // lo is the least x for which p(x) is true

分析:

当p(mid) =true时,mid是解,左边可能还有,区间为[low, mid]。

当p(mid)=false, 解不可能在mid的前面,包括mid,区间为[mid+1, high]。

 

如何求不满足条件的最后一个no呢?程序框架如下:

程序1.5
// warning: there is a nasty bug in this snippet!
binary_search(low, high, p):
   while low < high:
      mid = low + (high-low)/2    // note: division truncates
      if p(mid) == true:
         high = mid-1
      else:
         low = mid
   if p(low) == true:
      complain                // p(x) is true for all x in S!
   return low         // lo is the greatest x for which p(x) is false

但是这个程序有问题,当只剩两个解,且第一个解是no时,程序陷入死循环。

no

yes

解决方法是将mid = low + (high-low)/2改为mid = low + (high-low+1)/2。这样的话,当元素个数大于等于2个时,low<mid<=high, mid -1 < high,区间不会和上次重复,每次范围都会缩小,直到元素个数为1,所以不会陷入死循环。

例题1:

给出n个整数xi和m个询问,对于每个询问(a,b),输出闭区间[a, b]内的整数xi的个数。

有了前面的经验,我们知道“把数据存在数组A里并排序”是一个很好的预处理方法。

问题1: 大于等于a的第一个元素的下标L是什么?它等于a的lower_bound(下界)。如果所有元素都小于a,L = size,相当于把不存在的元素看作无穷大。

问题2: 小于等于b的最后一个元素的“下一个目标”R,或者说大于b的第一个目标R是什么?它和问题2是一样的,都是first yes问题。

这样问题的答案就是区间[L,R]的长度,R-L。

求上界的程序,只需要在程序1.3的基础上将>=v改为>v即可。

 

程序1.6

int binary_search_ub(int A[], int size,int v)

{

    int mid, low, high;

    low = 0; high = size;

    while(low < high) {

       mid = low + (high-low)/2;

       if(A[mid] > v) high = mid; 

       else   low = mid + 1;   

    }

    return low;

}

例题2:把一个包含n个正整数的序列划分成m个连续的子序列(每个正整数恰好属于一个序列)。设第i个序列的各数之和为S(i),你的任务是让所有S(i)的最大值尽量小。例如序列1 2 3 2 5 4 划分成3个序列的最优方案为1 2 3| 2 5| 4,其中S(1)、S(2),S(3)分别为6、7、4最大值为7;如果划分成1 2 |3 2| 5 4, 则最大值为9,不如刚才好。n <= 106,所有数之和不超过109

分析: 我们考虑一个新的问题:能否把输入序列划分成m个连续的子序列,使得所有S(i)均不超过x?我们把这个问题的答案用微词P(x)表示,则让P(x)为真的最小x就是原题的答案。P(x)并不难计算尽量往右划分即可。P(x)满足二分查找的条件,解空间对于的P(x)值是 no no no … yes yes yes … yes的形式。寻找first yes即可,时间复杂度为O(nlogM),M是所有数的和。



step1: 找到数组中和的最大值max(所有元素相加),最小值min(数组中最小值)。

step2: 在 min~max 这个范围内做二分查找。 找到其中使得条件成立(所有子序列和都小于这个数)的最小元素。

看了下面代码就明白了。

#include<iostream>
#include <ctime>
usingnamespace std;
#define N 10
#define INF 1000

int juge(int a[],int mid,int k)
{
	int i;
	int seg=0;
	int sum=0;
	for(i=0;i<N;i++)
	{
		sum+=a[i];
		if(sum>mid)//从左到右将数组元素之和与mid比较,如是大于则再起一段,最后看段的大小
		{
			sum=a[i];
			seg++;
		}
	}
	if(seg>=k)//若是段超过3,则必然不和条件
		return0;
	else
		return1;
}

int value(int a[],int low,int high,int segment)//分治法求解
{
	if(low>high)
		return high+1;
	else
	{
		int mid=(low+high)/2;
		if(juge(a,mid,segment)==1)//如果试验数mid符合要求,递归到前一半
			return value(a,low,mid-1,segment);
		else//如果试验数mid不符合要求,递归到后一半
			return value(a,mid+1,high,segment);
	}
}

int main()
{
	srand((unsigned)time(NULL));
	int a[N];
	for(int ifor=0;ifor<N;ifor++)
		a[ifor]=rand()%20;
	for(ifor=0;ifor<N;ifor++)
		cout<<a[ifor]<<"";

	//int a[N]={9,19,15,13,13,9,14,1,1,7};
	int m=3;
	cout<<endl;
	//求出队列中所有数的和max,还要求出当中最小的数min
	int min=INF,max=0;
	for(int i=0;i<N&& a[i]!='';i++)
	{
		max+=a[i];
		if(a[i]<min)
			min=a[i];
	}
	cout<<endl;
	int tem=value(a,min,max,m);//调用value函数求值
	cout<<tem<<endl;

	return0;
}



<think>好的,我现在需要帮助用户找到PHP实现二分查找的非递归算法示例代码。首先,我要回忆一下二分查找的基本原理,确保自己理解正确。二分查找是一种在有序数组中查找特定元素的算法,每次比较中间元素,如果中间元素小于目标值,则搜索右半部分,否则搜索左半部分,直到找到目标或确定不存在。非递归实现通常使用循环代替递归调用。 接下来,我需要确认用户的需求是明确的:他们想要PHP代码,而且是非递归版本的。用户可能已经了解递归实现,但希望避免递归带来的堆栈溢出风险或提高性能。此外,用户可能希望代码示例简洁明了,便于理解和应用。 然后,我需要参考已有的引用内容。引用[2]提到了二分查找的前提是数据排好序,并提到有非递归版本。虽然引用中的代码示例是C语言的,但逻辑是通用的,可以借鉴。例如,C语言中的循环结构和PHP类似,需要初始化左右指针,计算中间索引,并根据比较结果调整指针位置。 接下来,我需要将C语言的逻辑转化为PHP代码。PHP的语法与C有相似之处,比如变量声明、循环结构等。需要注意的是PHP的数组处理,以及参数传递方式。例如,PHP中的数组是动态的,不需要预先指定大小,但需要确保输入的数组是有序的。 然后,我需要确保代码正确性。非递归二分查找的关键点在于循环条件和中间值的计算。循环应该持续到左指针超过右指针。中间值计算应防止整数溢出,但在PHP中整数范围较大,这个问题可能不显著,但最好使用`intval(($left + $right) / 2)`或者位运算来确保正确性。 此外,需要考虑边界情况,例如空数组、目标不存在于数组中,或者目标正好是中间元素。代码应该处理这些情况,返回正确的索引或-1。 测试用例也是重要的,用户可能需要验证代码的正确性。提供几个测试示例,如查找存在的元素、不存在的元素、数组中的第一个和最后一个元素,可以帮助用户理解代码的运行情况。 最后,总结代码逻辑,强调数组必须有序,时间复杂度为O(log n),以及非递归的优势,比如空间复杂度较低。可能还需要提醒用户在使用前确保数组排序,或者提供排序的代码示例,但用户的问题主要集中在二分查找的实现,所以可能不需要扩展太多。 现在,综合以上思考,编写PHP的非递归二分查找函数,并附上解释和测试示例,确保代码正确、清晰,符合用户需求。</think>### PHP 实现二分查找(非递归算法) 二分查找算法要求**数组必须有序**,通过循环不断缩小搜索范围,时间复杂度为 $O(\log n)$。以下是具体实现步骤和示例代码: ```php function binarySearch($arr, $target) { $left = 0; $right = count($arr) - 1; while ($left <= $right) { $mid = intval(($left + $right) / 2); // 计算中间索引 if ($arr[$mid] == $target) { return $mid; // 找到目标,返回索引 } elseif ($arr[$mid] < $target) { $left = $mid + 1; // 目标在右半部分 } else { $right = $mid - 1; // 目标在左半部分 } } return -1; // 未找到目标 } ``` #### 代码解释 1. **初始化指针**:`$left` 和 `$right` 分别表示搜索区间的左右边界。 2. **循环条件**:`while ($left <= $right)` 确保搜索区间有效。 3. **中间值计算**:通过 `intval()` 确保中间索引为整数。 4. **比较逻辑**:根据中间值与目标值的大小关系,动态调整搜索区间。 #### 测试示例 ```php $sortedArray = [1, 3, 5, 7, 9, 11, 13]; echo binarySearch($sortedArray, 9); // 输出 4 echo binarySearch($sortedArray, 2); // 输出 -1 echo binarySearch($sortedArray, 13); // 输出 6 ``` #### 注意事项 - 输入数组**必须为升序排列**,否则算法失效[^2]。 - 非递归实现相比递归版本**节省栈空间**,适合处理大规模数据。 ---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值