二分法有「整数二分」和「实数二分」两种情况。实数二分的代码好写不易出错;整数二分的代码因为要考虑整除的问题,代码容易出错。
二分法的效率极高。比如在有序的n个数中找某个数,只需要二分log2n 次,也就是说它的时间复杂度是 O(log2n) 的。例如有 n = 10^7个数,只需要24 次就能找到答案。
总结一下,二分法把一个长度为 n 的有序序列上 O(n) 的查找时间,优化到了O(log2n)。注意,这个序列的数字一定要是「有序」的,二分才有意义。在乱序的一堆数字上搞二分,没有任何用处。所以这个数字序列如果是乱序的,应该先排序再二分。
只搜索一个数的话二分法不如直接暴力搜索,但是搜m个数。那么排序再二分就是 O(nlogn+mlogn),而你的暴力法是 O(mn)的,显然就快多了。
几种常见的二分代码
单调递增序列中找 x 或者 x 的后继
「在单调递增序列中找 x 或者 x 的后继」,即在单调递增数列a[] 中查找某个数 x,如果数列中没有 x,则找比它大的下一个数。左闭右开的编码,即[0,n)
int bin_search(int *a, int n, int x){ //a[0]~a[n-1]是单调递增的
int left = 0, right = n; //注意:不是 n-1,此时是左闭右开的[0,n)
while (left < right) {
int mid = left + (right-left)/2; //int mid = (left + right) >> 1;
if (a[mid] >= x) right = mid;
else left = mid + 1;
} //终止于left = right
return left; //特殊情况:a[n-1] < x时,返回n
}
- 当
a[mid] >= x
时,说明 x 在 mid 的左边,新的搜索区间是左半部分,left 不变,更新right = mid
。 - 当
a[mid] < x
时,说明 x 在 mid 的右边,新的搜索区间是右半部分,right 不变,更新left = mid + 1
。 - 代码执行完毕后,
left = right
,两者相等,即答案所处的位置。代码很高效,每次把搜索的范围缩小一半,总次数是 log(n)