二分查找：你以为懂了其实还有坑！（手撕代码必看）#

最新推荐文章于 2025-07-21 11:30:00 发布

原创最新推荐文章于 2025-07-21 11:30:00 发布 · 445 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#其他

文章目录

“二分还用学？不就是折半吗？” —— 刚毕业那会儿我也这么想，直到在真实项目中踩了连环坑…（血泪警告）

一、先来道送命题：循环条件怎么写？

新手教程都会告诉你这个模板：

left = 1;
right = length(arr);
while left <= right
    mid = floor((left + right)/2);
    if arr(mid) == target
        return mid;
    elseif arr(mid) < target
        left = mid + 1;
    else
        right = mid - 1;
    end
end

但是！ 当数组存在重复元素时，这个写法直接翻车！比如在数组 [2,3,3,3,4] 中找第一个3的位置，你会发现永远返回中间的3。

（敲黑板）这时候需要魔改判断条件：

while left < right  # 注意这里变成了小于！
    mid = floor((left + right)/2);
    if arr(mid) >= target
        right = mid;
    else
        left = mid + 1;
    end
end

这个变种写法才能准确锁定左边界。看到没？循环条件的等号直接决定了算法的行为模式！

二、死循环警告：mid到底怎么算？

你以为 mid = (left+right)/2 就完事了？在MATLAB里确实没问题，但是在其他语言中（比如C++）可能引发整数溢出！

更骚的操作是：

mid = left + floor((right - left)/2);

这样写不仅避免溢出，还在处理超大数据集时提升计算精度（别问我是怎么知道的，调试了3个小时的血泪教训）

三、实战中的骚操作：用二分法找最优解

最近在优化图像处理算法时，需要找到最佳阈值使信噪比最大。传统遍历法要跑8小时，改用二分后…

low = 0;
high = 255;
for i = 1:20  # 20次迭代足够双精度收敛
    mid1 = floor((2*low + high)/3);
    mid2 = floor((low + 2*high)/3);
    if evaluate(mid1) > evaluate(mid2)
        high = mid2;
    else
        low = mid1;
    end
end

这个三分查找法比传统二分快3倍！（注意这里用到了三分而不是二分，但核心思想相通）

四、MATLAB特供坑：数组索引从1开始！

用惯了Python的童鞋注意了：

% 错误示范（会导致索引越界）
arr = [2,4,6,8];
left = 0;  # MATLAB数组不能从0开始！
right = length(arr);

正确的打开方式：

left = 1;
right = length(arr);
while left <= right
    mid = left + floor((right - left)/2);
    % ...后续操作
end

曾经有实习生因为这个错误导致整个实验数据出错（最后通宵重跑数据…）

五、性能玄学：向量化操作的威力

在MATLAB中，传统的循环二分查找可能被向量化操作吊打。比如：

% 传统二分查找（耗时约0.8秒）
tic;
for i = 1:1e6
    % 二分查找逻辑
end
toc;

% 向量化查找（耗时0.02秒！！）
tic;
find(arr == target, 1);
toc;

当然这要看数据特征，但提醒我们：不要为了用算法而用算法！（性能测试才是王道）

六、隐藏技巧：用二分法调试神经网络

在模型训练中发现loss震荡？可能是学习率设置不当。这时候可以：

low_lr = 1e-5;
high_lr = 1e-2;
for epoch = 1:10
    mid_lr = exp((log(low_lr) + log(high_lr))/2);  # 对数空间更合理！
    train_with(mid_lr);
    if loss_improved()
        low_lr = mid_lr;
    else
        high_lr = mid_lr;
    end
end