[实战] 二分查找与哈希表查找：原理、对比与C语言实现（附完整C代码）-优快云博客

本文链接：https://blog.youkuaiyun.com/jz_ddk/article/details/147195078

二分查找与哈希表查找：原理、对比与C语言实现

一、引言

在计算机科学中，高效的数据查找是核心问题之一。本文深入解析两种经典查找算法：二分查找与哈希表查找，从算法原理、时间复杂度、适用场景到完整C语言实现，提供系统化的对比与实践指南。

二、算法原理详解

1. 二分查找 (Binary Search)

核心思想

通过有序数据集的中间元素与目标值的比较，将搜索范围缩小一半，重复此过程直至找到目标或范围为空。

算法流程

初始化左右边界 left=0, right=n-1
循环直到 left > right：
- 计算中点 mid = left + (right-left)/2
- 若 arr[mid] == target，返回索引
- 若 arr[mid] < target，调整左边界 left = mid + 1
- 否则调整右边界 right = mid - 1
返回未找到标志 -1

时间复杂度

最优：O(1)
平均/最差：O(log n)

空间复杂度

迭代实现：O(1)
递归实现：O(log n)（栈空间）

2. 哈希表查找 (Hash Table)

核心思想

通过哈希函数将键(key)映射到存储位置，实现近似O(1)时间复杂度的查找。

关键组件

哈希函数：将键转换为数组索引
（示例：hash(key) = key % capacity）
冲突解决：
- 链地址法：每个槽位存储链表
- 开放寻址法：线性探测/二次探测

算法流程

计算键的哈希值 hash_index = hash(key)
根据冲突解决策略查找目标：
- 链地址法：遍历链表
- 开放寻址法：按探测序列查找空槽
找到返回数据，未找到返回特定标志

时间复杂度

最优：O(1)
最差：O(n)（所有键冲突时）

空间复杂度

取决于负载因子 α = n/m
通常为 O(n)

三、算法对比分析

特性	二分查找	哈希表查找
数据结构要求	必须有序	无要求
查找时间复杂度	O(log n)	O(1)（平均）
插入/删除效率	O(n)（需维护有序性）	O(1)（平均）
空间复杂度	O(1)	O(n)（含指针/探测开销）
实现复杂度	简单	较高（需处理冲突/扩容）
适用场景	静态或低频更新数据集	高频更新数据集

四、使用场景选择指南

适用二分查找的场景：

数据预先有序且不频繁修改
内存受限环境（无额外指针开销）
需要范围查询（如找最小大于某值的元素）

适用哈希表的场景：

需要极速查找且数据动态变化
不依赖数据顺序
允许牺牲空间换时间

五、C语言完整实现

1. 二分查找实现

迭代版本

int binarySearch(int arr[], int size, int target) {
    int left = 0, right = size - 1;
    while (left <= right) {
        int mid = left + (right - left) / 2;
        if (arr[mid] == target) return mid;
        if (arr[mid] < target) left = mid + 1;
        else right = mid - 1;
    }
    return -1;
}

递归版本

int binarySearchRecursive(int arr[], int left, int right, int target) {
    if (left > right) return -1;
    int mid = left + (right - left) / 2;
    if (arr[mid] == target) return mid;
    if (arr[mid] < target) 
        return binarySearchRecursive(arr, mid + 1, right, target);
    else 
        return binarySearchRecursive(arr, left, mid - 1, target);
}

2. 哈希表实现（链地址法）

#include <stdio.h>
#include <stdlib.h>

#define INIT_CAPACITY 10
#define LOAD_FACTOR 0.75

typedef struct Node {
    int key;
    int value;
    struct Node* next;
} Node;

typedef struct {
    Node** buckets;
    int size;
    int capacity;
} HashTable;

// 初始化哈希表
HashTable* createHashTable() {
    HashTable* ht = malloc(sizeof(HashTable));
    ht->capacity = INIT_CAPACITY;
    ht->size = 0;
    ht->buckets = calloc(ht->capacity, sizeof(Node*));
    return ht;
}

// 哈希函数
int hash(int key, int capacity) {
    return key % capacity;
}

// 扩容操作
void resize(HashTable* ht) {
    int new_cap = ht->capacity * 2;
    Node** new_buckets = calloc(new_cap, sizeof(Node*));
    
    for (int i = 0; i < ht->capacity; i++) {
        Node* curr = ht->buckets[i];
        while (curr) {
            Node* next = curr->next;
            int idx = hash(curr->key, new_cap);
            curr->next = new_buckets[idx];
            new_buckets[idx] = curr;
            curr = next;
        }
    }
    
    free(ht->buckets);
    ht->buckets = new_buckets;
    ht->capacity = new_cap;
}

// 插入键值对
void put(HashTable* ht, int key, int value) {
    if ((double)ht->size / ht->capacity > LOAD_FACTOR) {
        resize(ht);
    }
    
    int idx = hash(key, ht->capacity);
    Node* newNode = malloc(sizeof(Node));
    newNode->key = key;
    newNode->value = value;
    newNode->next = ht->buckets[idx];
    ht->buckets[idx] = newNode;
    ht->size++;
}

// 查找键
int get(HashTable* ht, int key) {
    int idx = hash(key, ht->capacity);
    Node* curr = ht->buckets[idx];
    while (curr) {
        if (curr->key == key) return curr->value;
        curr = curr->next;
    }
    return -1; // 未找到
}

六、验证代码

1. 二分查找验证

void testBinarySearch() {
    int arr[] = {2,5,8,12,16,23,38,56,72,91};
    int size = sizeof(arr)/sizeof(arr[0]);
    
    // 测试存在元素
    printf("测试存在元素:\n");
    printf("查找23: 索引%d\n", binarySearch(arr, size, 23));  // 应输出5
    printf("查找2: 索引%d\n", binarySearch(arr, size, 2));    // 应输出0
    
    // 测试不存在元素
    printf("\n测试不存在元素:\n");
    printf("查找99: 索引%d\n", binarySearch(arr, size, 99));  // 应输出-1
}

执行结果：

=== 二分查找测试 ===
查找23 => 索引5 (期望5)
查找2  => 索引0 (期望0)
查找99 => 索引-1 (期望-1)

2. 哈希表验证

void testHashTable() {
    HashTable* ht = createHashTable();
    put(ht, 1001, 50);
    put(ht, 2002, 80);
    put(ht, 3003, 95);
    
    printf("测试哈希表查找:\n");
    printf("查找1001: 值%d\n", get(ht, 1001));  // 应输出50
    printf("查找3003: 值%d\n", get(ht, 3003));  // 应输出95
    printf("查找9999: 值%d\n", get(ht, 9999));  // 应输出-1
}

=== 哈希表测试 ===
查找1001 => 值50 (期望50)
查找3003 => 值95 (期望95)
查找9999 => 值-1 (期望-1)

执行结果：

七、性能对比测试

#include <time.h>

#define DATA_SIZE 1000000000

void performanceTest() {
    // 准备有序数组
    int* sortedArr = malloc(DATA_SIZE * sizeof(int));
    for (int i = 0; i < DATA_SIZE; i++) {
        sortedArr[i] = i * 2;
    }
    
    // 准备哈希表数据
    HashTable* ht = createHashTable();
    for (int i = 0; i < DATA_SIZE; i++) {
        put(ht, i * 2, i);
    }
    
    clock_t start, end;
    
    // 测试二分查找
    start = clock();
    binarySearch(sortedArr, DATA_SIZE, DATA_SIZE * 2 - 2);
    end = clock();
    printf("二分查找耗时: %f秒\n", (double)(end - start)/CLOCKS_PER_SEC);
    
    // 测试哈希查找
    start = clock();
    get(ht, DATA_SIZE * 2 - 2);
    end = clock();
    printf("哈希查找耗时: %f秒\n", (double)(end - start)/CLOCKS_PER_SEC);
}

对比结果显示：哈希表查找比二分法查找在大量数据时，优势明显。
1000000数据对比情况，不分胜负

=== 性能对比测试（数据量：1000000）===
二分查找耗时: 0.000000秒 (结果:999999)
哈希查找耗时: 0.000000秒 (结果:999999)

100000000数据对比情况，哈希优势明显

=== 性能对比测试（数据量：100000000）===
二分查找耗时: 0.005000秒 (结果:99999999)
哈希查找耗时: 0.000000秒 (结果:99999999)

八、结论

二分查找在有序数据集上表现出色，适合静态数据场景
哈希表在动态数据环境下提供最优查找性能，但需要处理冲突与扩容
实际选择需综合考虑数据特征、操作频率和资源限制

通过本文的代码实现与对比测试，开发者可以根据具体需求选择最适合的查找策略。两种算法各有千秋，理解其底层原理是优化系统性能的关键。

完整实现和测试代码免费免分下载。