第十章——搜索-优快云博客

小结

‧ 二分查找依赖于数据的有序性，通过循环逐步缩减一半搜索区间来实现查找。它要求输入数据有序，且仅适用于数组或基于数组实现的数据结构。

‧ 暴力搜索通过遍历数据结构来定位数据。线性搜索适用于数组和链表，广度优先搜索和深度优先搜索适用于图和树。此类算法通用性好，无须对数据预处理，但时间复杂度𝑂(𝑛)较高。

‧ 哈希查找、树查找和二分查找属于高效搜索方法，可在特定数据结构中快速定位目标元素。此类算法效率高，时间复杂度可达𝑂(log𝑛)甚至𝑂(1)，但通常需要借助额外数据结构。

‧ 查找算法效率对比：

‧ 实际中，我们需要对数据体量、搜索性能要求、数据查询和更新频率等因素进行具体分析，从而选择合适的搜索方法。

‧ 各类搜索策略适用场景：

线性搜索适用于小型或频繁更新的数据：

‧ 通用性较好，无须任何数据预处理操作。假如我们仅需查询一次数据，那么其他三种方法的数据预处理
的时间比线性搜索的时间还要更长。
‧ 适用于体量较小的数据，此情况下时间复杂度对效率影响较小。
‧ 适用于数据更新频率较高的场景，因为该方法不需要对数据进行任何额外维护。

二分查找适用于大型、排序的数据：

‧ 适用于大数据量的情况，效率表现稳定，最差时间复杂度为𝑂(log𝑛)。

‧ 数据量不能过大，因为存储数组需要连续的内存空间。

‧ 不适用于高频增删数据的场景，因为维护有序数组的开销较大。

哈希查找适合对查询效率要求较高且无须范围查询的数据：

‧ 适合对查询性能要求很高的场景，平均时间复杂度为𝑂(1)。

‧ 不适合需要有序数据或范围查找的场景，因为哈希表无法维护数据的有序性。

‧ 对哈希函数和哈希冲突处理策略的依赖性较高，具有较大的性能劣化风险。

‧ 不适合数据量过大的情况，因为哈希表需要额外空间来最大程度地减少冲突，从而提供良好的查询性能。

树查找适用于需要维护顺序和支持范围查询的大型动态数据：

‧ 适用于海量数据，因为树节点在内存中是离散存储的。
‧ 适合需要维护有序数据或范围查找的场景。
‧ 在持续增删节点的过程中，二叉搜索树可能产生倾斜，时间复杂度劣化至𝑂(𝑛)。
‧ 若使用AVL树或红黑树，则各项操作可在𝑂(log𝑛)效率下稳定运行，但维护树平衡的操作会增加额外开销。