NSDictionary的实质和实现原理

本文探讨了NSDictionary的实现原理,它基于哈希表,使用拉链法处理冲突。内容涉及哈希概念、哈希表存储过程、负载因子、重哈希以及哈希表可能面临的问题。Objective-C中,由于对象的hash通常是其地址,因此冲突概率极小,NSDictionary在取数据时会通过isEqual确保找到正确的key。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、NSDictionary使用原理

    1.NSDictionary(字典)是使用 hash表来实现key和value之间的映射和存储的, hash函数设计的好坏影响着数据的查找访问效率。

    - (void)setObject:(id)anObject forKey:(id <NSCopying>)aKey;

   2.Objective-C中的字典 NSDictionary 底层其实是一个哈希表,实际上绝大多数语言中字典都通过哈希表实现,

二、哈希的原理

   哈希概念:哈希表的本质是一个数组,数组中每一个元素称为一个箱子(bin),箱子中存放的是键值对。    

三、哈希表的存储过程:

    1. 根据 key计算出它的哈希值 h。

    2.假设箱子的个数为 n,那么这个键值对应该放在第 (h % n) 个箱子中。

    3.如果该箱子中已经有了键值对,就使用开放寻址法或者拉链法解决冲突。

    在使用拉链法解决哈希冲突时,每个箱子其实是一个链表,属于同一个箱子的所有键值对都会排列在链表中。

    哈希表还有一个重要的属性:负载因子(load factor),它用来衡量哈希表的 空/满 程度,一定程度上也可以体现查询的效率,计算公式为:

   负载因子 =总键值对数 /箱子个数

   负载因子越大,意味着哈希表越满,越容易导致冲突,性能也就越低。因此,一般来说,当负载因子大于某个常数(可能是1,或者0.75等)时,哈希表将自动扩容。

重哈希概念:    

   哈希表在自动扩容时,一般会创建两倍于原来个数的箱子,因此即使 key的哈希值不变,对箱子个数取余的结果也会发生改变,因此所有键值对的存放位置都有可能发生改变,这个过程也称为重哈希(rehash)。

    哈希表的扩容并不总是能够有效解决负载因子过大的问题。假设所有 key的哈希值都一样,那么即使扩容以后他们的位置也不会变化。虽然负载因子会降低,但实际存储在每个箱子中的链表长度并不发生改变,因此也就不能提高哈希表的查询性能。

四、总结,细心的读者可能会发现哈希表的两个问题:

   1.如果哈希表中本来箱子就比较多,扩容时需要重新哈希并移动数据,性能影响较大。

   2.如果哈希函数设计不合理,哈希表在极端情况下会变成线性表,性能极低。

五、hash的实现

NSDictionary生成hash表使用的是拉链法,可以理解为“链表的数组”即:

根结构为数组,每个元素为链表

添加key的时候,会把key的hash对根结构的长度取余,结果作为根结构的下标,再把key插入到下标对应的链表元素中

解决hash冲突

hash冲突即存在多个hash一样的key

一般来说拉链法需要涉及到解决hash冲突,但巧就巧在,ObjC中一般对象的hash就是它本身的地址,所以几乎是不可能冲突的,对于NSString这类重写了hash方法的,会同时要求重写isEqual方法

。当真的遇到hash冲突的话,NSDictionary插入时会无视冲突,而在取数据时,在找到hash后会多一步通过isEqual对比是不是需要的key,如果不是就继续往下找,一般来说出现hash冲突的key都会在同一个链表的相邻位置,所以查找的消耗会非常的低

同时NSHashTable,NSSet,NSMapTable的实现都是基于拉链法生成的hash表 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值