哈希表 学习

看了几篇文章,主要意思就是用简单的值index,去索引复杂的值key,进而找到想要的值value.

哈希算法主旨:index  = f(key)

数据存放格式:(key.value)

 

但是存在问题是,

1.哈希算法使不同的key产生相同的index

2.分配给哈希表的内存满了之后,整个哈希表的迁移太累赘了。

 

针对第一个问题,下面介绍两个方案:

拉链法:http://www.cnblogs.com/xiekeli/archive/2012/01/13/2321207.html

相同index的键值对,就用链表往后去存储。

typedef struct _node{
      char *key;
      char *value;
      struct _node *next;
}node;

#define HASHSIZE 101
static node* hashtab[HASHSIZE];  //hash index

 

 

 

哈希桶:http://www.cnblogs.com/xiekeli/archive/2012/01/16/2323391.html

struct Pair {
    char *key;
    char *value;
};

struct Bucket {
    unsigned int count;
    Pair *pairs;
};

struct StrMap {
    unsigned int count;
    Bucket *buckets;
};

 

首先哈希桶的个数是固定的,有用户构建的时候输入,一旦构建,个数就已经固定;查找的时候首先将key值通过哈希函数获取哈希值,根据哈希值获取到对应的哈希桶,然后遍历哈希桶内的pairs数组获取;


这两种实现方法看似比较类似,但也有差异:

基于哈希桶的情况下,由于Hash桶容量的限制,所以,有可能发生Hash表填不满的情况,也就是,虽然Hash表里面还有空位,但是新建的表项由于冲突过多,而不能装入Hash表中。不过,这样的实现也有其好处,就是查表的最大开销是可以确定的,因为最多处理的冲突数是确定的,所以算法的时间复杂度为O(1)+O(m),其中m为Hash桶容量。

而另一种通过链表的实现,由于Hash桶的容量是无限的,因此,只要没有超出Hash表的最大容量,就能够容纳新建的表项。但是,一旦发生了Hash冲突严重的情况,就会造成Hash桶的链表过长,大大降低查找效率。在最坏的情况下,时间复杂度退化为O(n),其中n为Hash表的总容量。当然,这种情况的概率小之又小,几乎是可以忽略的。

 

 

 

 比较好的代码:

http://blog.youkuaiyun.com/smstong/article/details/51145786

 

 

 

 

转载于:https://www.cnblogs.com/WMCH/p/8288124.html

学习哈希表可以在多个方面取得成果,以下从概念理解、性能分析、应用和代码实现等方面进行阐述。 ### 概念理解 了解到哈希表是一种高效的键值对存储数据结构,其核心思想是通过哈希函数将键映射到存储桶中,以实现快速的数据插入、查找和删除操作。这种数据结构在各种计算任务中都有广泛应用,并且随着现代计算系统多核处理器和并行计算能力的普及,并行哈希表的设计与实现也成为研究热点[^1]。 ### 性能分析 认识到哈希表的性能主要取决于哈希函数的设计和冲突处理策略。一个好的哈希函数能够将键均匀地分布到各个存储桶中,减少冲突的发生,从而提高哈希表的性能。同时,也了解到不同的冲突处理方法(如开放寻址法、链地址法等)对哈希表性能的影响。 ### 应用场景 掌握了哈希表在不同领域的应用,如数据库系统中Redis数据库的哈希表实现,它通过特定的数据结构设计、操作算法和性能优化策略,实现了高效的数据存储和查询[^2]。在编程语言中,如Python,也可以使用哈希表来解决实际问题,例如编码实现保存商品订单信息,通过自定义哈希函数将商品订单号映射到哈希表中,实现快速的订单信息查询[^3]。 ### 代码实现 能够使用编程语言实现简单的哈希表。例如,在Python中可以通过自定义哈希函数和数据结构来实现一个基本的哈希表,包括哈希函数的设计、数据的插入和查询操作。以下是一个简单的Python示例: ```python # 移位叠加哈希算法 def hash_code(key, hash_table_size): # 转换成字符串 key_s = str(key) # 保存求和结果 s = 0 # 使用切片 for i in range(0, len(key_s), 3): s += int(key_s[i:i + 3]) return s % hash_table_size # 商品信息 products = [[20201011, 400.00], [19981112, 300], [20221212, 200]] # 哈希表长度 hash_size = 10 # 哈希表 hash_table = [None] * hash_size # 以哈希表方式进行存储 for p in products: key = hash_code(p[0], hash_size) hash_table[key] = p[1] # 显示哈希表中的数据 print("哈希表中的数据:", hash_table) # 根据订单号进行查询 hash_val = hash_code(19981112, hash_size) val = hash_table[hash_val] print("订单号为{0}的金额为{1}".format(19981112, val)) ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值