第15周项目2——用哈希法组织关键字

本文通过两个示例介绍如何使用线性探测法和链地址法处理哈希冲突,包括哈希函数的设计、哈希表的构建过程以及查找长度的计算。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题及代码:

/*             
*Copyright(c++)2015,烟台大学计算机与控制工程学院             
*All rights reserved.             
*文件名称:CPP1.cpp             
*作者:宋 晨             
*完成日期:2015年12月07日             
*版本号:v1.0             
*             
*问题描述:已知一个关键字序列为if、while、for、case、do、break、else、struct、union、int、double、float、char、long、bool,
           共15个字符串,哈希函数H(key)为关键字的第一个字母在字母表中的序号,哈希表的表长为26。 
        (1)若处理冲突的方法采用线性探测法,请设计算法,输出每个关键字对应的H(key),输出哈希表,并求成功情况下的平均查找长度。 
        (2)若处理冲突的方法采用链地址法,请设计算法,输出哈希表,并计算成功情况和不成功情况下的平均查找长度。
*/    
(1)

#include <stdio.h>
#include <string.h>
#define N 15
#define M 26
int H(char *s)
{
    return ((*s-'a'+1)%M);
}

int main()
{
    char *s[N]= {"if", "while", "for", "case", "do", "break", "else", "struct", "union", "int", "double", "float", "char", "long", "bool"};
    int i, j, k;
    char HT[M][10];
    int Det[M];   //存放探测次数
    for(i=0; i<M; i++)
    {
        HT[i][0]='\0';
        Det[i]=0;
    }
    printf("字符串 key\tH(key)\n");
    printf("------------------------\n");
    for(i=0; i<N; i++)
    {
        j=H(s[i]);  //求哈希值
        printf("%s\t\t%d\n", s[i],j);
        k=0;   //探测次数初值
        while(1)
        {
            k++;    //累加探测次数
            if(HT[j][0]=='\0')   //当不冲突时,直接放到该处
            {
                strcpy(HT[j], s[i]);
                break;
            }
            else    //冲突时,采用线性探查法求下一个地址
            {
                j=(j+1)%M;
            }
        }
        Det[j]=k;
    }
    printf("---------------------\n");
    printf("哈希表\n");
    printf("位置\t字符串\t探查次数\n");
    printf("---------------------\n");
    for(i=0; i<M; i++)
        printf("%d\t%s\t%d\n", i, HT[i], Det[i]);
    printf("---------------------\n");
    k=0;
    for(i=0; i<M; i++)
        k+=Det[i];
    printf("查找成功情况下的平均查找长度 %f\n", 1.0*k/N);
    return 0;
}


(2)

#include <stdio.h>
#include <string.h>
#include <malloc.h>
#define N 15
#define M 26
typedef struct node   //定义哈希链表的节点类型
{
    char *key;
    struct node *next;
} LNode;

typedef struct
{
    LNode *link;
} HTType;

int H(char *s)   //实现哈希函数
{
    return ((*s-'a'+1)%M);
}

//构造哈希表
void Hash(char *s[], HTType HT[])
{
    int i, j;
    LNode *q;
    for(i=0; i<M; i++)   //哈希表置初值
        HT[i].link=NULL;
    for(i=0; i<N; i++)   //存储每一个关键字
    {
        q=(LNode*)malloc(sizeof(LNode));   //创建新节点
        q->key = (char*)malloc(sizeof(strlen(s[i])+1));
        strcpy(q->key, s[i]);
        q->next=NULL;
        j=H(s[i]);    //求哈希值
        if(HT[j].link==NULL)   //不冲突,直接加入
            HT[j].link=q;
        else        //冲突时,采用前插法插入
        {
            q->next = HT[j].link;
            HT[j].link=q;
        }
    }
}pe HT[])
{
    int i;
    LNode *p;
    printf("哈希表\n");
    printf("位置\t关键字序列\n");
    printf("---------------------\n");
    for(i=0; i<M; i++)
    {
        printf(" %d\t", i);
        p=HT[i].link;
        while(p!=NULL)
        {
            printf("%s ", p->key);
            p=p->next;
        }
        printf("\n");
    }
    printf("---------------------\n");
}

//求查找成功情况下的平均查找长度
double SearchLength1(char *s[], HTType HT[])
{
    int i, k, count = 0;
    LNode *p;
    for(i=0; i<N; i++)
    {
        k=0;
        p=HT[H(s[i])].link;
        while(p!=NULL)
        {
            k++;   //p!=NULL,进入循环就要做一次查找
            if(strcmp(p->key, s[i])==0)   //若找到,则退出
                break;
            p=p->next;
        }
        count+=k;
    }
    return 1.0*count/N;   //成功情况仅有N种
}

//求查找不成功情况下的平均查找长度
double SearchLength2(HTType HT[])
{
    int i, k, count = 0;  //count为各种情况下不成功的总次数
    LNode *p;
    for(i=0; i<M; i++)
    {
        k=0;
        p=HT[i].link;
        while(p!=NULL)
        {
            k++;
            p=p->next;
        }
        count+=k;
    }
    return 1.0*count/M;   //不成功时,在表长为M的每个位置上均可能发生
}
int main()
{
    HTType HT[M];
    char *s[N]= {"if", "while", "for", "case", "do", "break", "else", "struct", "union", "int", "double", "float", "char", "long", "bool"};
    Hash(s, HT);
    DispHT(HT);
    printf("查找成功情况下的平均查找长度 %f\n", SearchLength1(s, HT));
    printf("查找不成功情况下的平均查找长度 %f\n", SearchLength2(HT));
    return 0;
}


运行结果:

(1)


(2)


<think>我们正在讨论Java中哈希法的实现和使用。根据引用内容,我们可以知道Java中哈希表的基本实现、如何使用哈希表进行查找,以及一些实际应用示例。下面我将从几个方面来组织回答:哈希表的基本概念、Java中的实现、使用方法以及性能优化等。 ### 1. 哈希表的基本概念 哈希表(Hash Table)是一种通过哈希函数将键(Key)映射到存储位置的数据结构,从而实现快速查找。核心组件包括: - **哈希函数**:将键映射到哈希值的函数,理想情况下应均匀分布以减少冲突。 - **冲突解决**:当不同键映射到同一位置时,需要有解决冲突的方法,常见的有链地址法和开放寻址法。 ### 2. Java中的哈希表实现 Java提供了多种哈希表实现,主要位于`java.util`包中,包括: - **HashMap**:最常用的哈希表实现,基于键值对存储,允许`null`键和`null`值,非线程安全。 - **Hashtable**:线程安全的哈希表,但性能较低,不推荐使用(可用`ConcurrentHashMap`替代)。 - **LinkedHashMap**:继承自`HashMap`,通过双向链表维护插入顺序或访问顺序。 - **ConcurrentHashMap**:支持高并发的线程安全哈希表,采用分段锁技术。 #### 示例:创建和使用HashMap ```java import java.util.HashMap; public class HashMapExample { public static void main(String[] args) { // 创建HashMap实例 HashMap<String, Integer> map = new HashMap<>(); // 插入键值对 map.put("apple", 10); map.put("banana", 20); map.put("orange", 30); // 通过键获取值 int appleCount = map.get("apple"); // 返回10 System.out.println("苹果数量: " + appleCount); // 检查键是否存在 if (map.containsKey("banana")) { System.out.println("香蕉存在"); } // 遍历所有键值对 map.forEach((key, value) -> System.out.println(key + ": " + value) ); } } ``` ### 3. 哈希冲突解决方法 Java的`HashMap`采用**链地址法**解决冲突(Java 8后当链表长度超过阈值时转换为红黑树): - **链地址法**:每个桶(bucket)是一个链表(或树),冲突的元素被添加到同一桶的链表中。 - **开放寻址法**:Java的`ThreadLocalMap`使用此方法,但`HashMap`未采用。 #### 冲突解决对性能的影响 - 理想情况下,哈希函数均匀分布,查找时间复杂度为$O(1)$。 - 最坏情况下(所有键冲突),链表退化为$O(n)$,树化后提升为$O(\log n)$。 ### 4. 自定义哈希函数 在Java中,自定义对象作为键时需重写`hashCode()`和`equals()`方法: - `hashCode()`:计算对象的哈希码,应满足一致性(同一对象多次调用结果相同)和均匀分布。 - `equals()`:用于比较两个对象是否相等。 #### 示例:自定义键类型 ```java class Student { private String id; private String name; public Student(String id, String name) { this.id = id; this.name = name; } @Override public int hashCode() { // 使用Objects类辅助生成哈希码 return java.util.Objects.hash(id, name); } @Override public boolean equals(Object obj) { if (this == obj) return true; if (obj == null || getClass() != obj.getClass()) return false; Student other = (Student) obj; return Objects.equals(id, other.id) && Objects.equals(name, other.name); } } // 使用示例 HashMap<Student, Integer> studentScores = new HashMap<>(); studentScores.put(new Student("001", "Alice"), 90); int score = studentScores.get(new Student("001", "Alice")); // 返回90 ``` ### 5. 性能调优 - **初始容量和负载因子**:创建`HashMap`时可指定初始容量和负载因子(默认0.75)。当元素数量超过`容量*负载因子`时,自动扩容并重新哈希。 ```java // 初始容量16,负载因子0.75 HashMap<String, Integer> map = new HashMap<>(16, 0.75f); ``` - **避免频繁扩容**:预估元素数量,设置合适的初始容量。 - **选择高效哈希函数**:减少冲突,提升分布均匀性。 ### 6. 高级应用:一致性哈希 在分布式系统中,一致性哈希用于解决数据分片和负载均衡问题。Java中可通过第三方库(如Google Guava)实现: ```java import com.google.common.hash.Hashing; import java.nio.charset.StandardCharsets; // 计算一致性哈希值 int hash = Hashing.consistentHash( Hashing.sha256().hashString("key", StandardCharsets.UTF_8), numberOfNodes ); ``` ### 总结 Java中哈希法的实现主要依赖于`HashMap`等集合类,使用时需注意: 1. 正确重写`hashCode()`和`equals()`方法 2. 合理配置初始容量和负载因子 3. 理解冲突解决机制及其对性能的影响 通过优化哈希函数和参数设置,可显著提升哈希表性能[^1][^2][^3][^4]。 --- §§相关问题§§ 1. Java中HashMap的扩容机制具体是如何工作的? 2. 如何设计一个高效的哈希函数来减少冲突? 3. 在并发环境下,ConcurrentHashMap是如何实现线程安全的? 4. 一致性哈希在分布式系统中有哪些具体应用场景?</think>### Java 哈希法实现与使用详解 #### 一、核心实现原理 1. **哈希函数设计** - Java 使用 `hashCode()` 方法生成初始哈希值 - 默认实现基于对象内存地址,可自定义重写 - 优化公式:$index = (h \oplus (h >>> 16)) \& (capacity - 1)$ (高位参与运算,减少碰撞概率) 2. **冲突解决机制** ```mermaid graph TD A[发生哈希冲突] --> B[Java 8+] A --> C[Java 7-] B --> D[链表长度<8?] D -->|是| E[链表存储] D -->|否| F[转红黑树存储] C --> G[纯链表结构] ``` #### 二、标准库实现类 | **类名** | **特点** | **线程安全** | **适用场景** | |------------------|----------------------------------|-------------|--------------------------| | `HashMap` | 数组+链表/红黑树,负载因子0.75 | ❌ | 通用键值存储 | | `Hashtable` | 全方法同步,性能较低 | ✔️ | 遗留系统兼容 | | `ConcurrentHashMap` | 分段锁技术,高并发优化 | ✔️ | 高并发场景[^2] | | `LinkedHashMap` | 维护插入顺序双向链表 | ❌ | 需要顺序访问的场景 | #### 三、基础操作示例 ```java import java.util.HashMap; public class HashExample { public static void main(String[] args) { // 1. 创建哈希表 HashMap<String, Integer> inventory = new HashMap<>(16); // 初始容量16 // 2. 插入数据 inventory.put("apple", 50); inventory.put("banana", 30); inventory.putIfAbsent("orange", 40); // 不存在时插入 // 3. 访问数据 int appleCount = inventory.get("apple"); // 返回50 Integer unknown = inventory.get("pear"); // 返回null // 4. 更新数据 inventory.compute("apple", (k, v) -> v + 10); // apple=60 inventory.merge("banana", 5, Integer::sum); // banana=35 // 5. 删除数据 inventory.remove("orange"); // 6. 遍历方式 inventory.forEach((k, v) -> System.out.println(k + ": " + v) ); } } ``` #### 四、性能优化要点 1. **初始容量设置** - 预估元素数量$N$,初始容量 = $N / 0.75 + 1$ - 避免多次扩容:`new HashMap<>(1000)` 优于默认16 2. **负载因子调整** - 默认0.75(空间/时间平衡点) - 高频查询场景:降低至0.5(减少冲突) - 内存敏感场景:提高至0.9(减少空间) 3. **自定义对象作为键** - **必须重写** `hashCode()` 和 `equals()` 方法 - 示例实现: ```java class Product { private String id; private String name; @Override public int hashCode() { return Objects.hash(id, name); // 多字段联合哈希 } @Override public boolean equals(Object o) { if (this == o) return true; if (!(o instanceof Product)) return false; Product p = (Product) o; return id.equals(p.id) && name.equals(p.name); } } ``` #### 五、高级应用场景 1. **缓存实现** ```java import java.util.LinkedHashMap; import java.util.Map; class LRUCache<K, V> extends LinkedHashMap<K, V> { private final int maxSize; public LRUCache(int maxSize) { super(maxSize, 0.75f, true); // 访问顺序排序 this.maxSize = maxSize; } @Override protected boolean removeEldestEntry(Map.Entry<K,V> eldest) { return size() > maxSize; // 自动移除最旧条目 } } ``` 2. **数据去重** ```java Set<String> uniqueWords = new HashSet<>(); words.stream().filter(uniqueWords::add).count(); // 高效去重 ``` 3. **一致性哈希(分布式系统)** ```java import com.google.common.hash.Hashing; int nodeIndex = Hashing.consistentHash( Hashing.sha256().hashString(key, UTF_8), nodeCount ); ``` #### 六、最佳实践 1. **线程安全选择** - 优先用 `ConcurrentHashMap` 替代 `Collections.synchronizedMap()` - 分段锁提升并发效率 2. **避免哈希碰撞攻击** - 使用 `String` 作键时启用防护: `-Djdk.map.althashing.threshold=512` 3. **监控与调优** - 使用JMX监控负载因子:`java.util.Collections$SynchronizedMap` - 调整JVM参数:`-XX:+PrintHeapAtGC` 分析内存占用 > **关键原则**:哈希表在最优情况下提供$O(1)$时间复杂度的查找/插入,但需避免哈希退化(所有元素进入同一桶)导致性能降至$O(n)$或$O(\log n)$[^1][^3]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值