最头疼的必问哈希

HashMap 底层实现原理

HashMap 根据键的hashCode 值存储数据,大多数情况下可以直接定位到它的值.因而具有很快的访问速度,但是遍历顺序却不确定的.HashMap 最多只允许一条记录的键为null,允许多条记录的值为null。
HashMap 非线程安全,即任一时刻可以有多个线程同时写HashMap,可能会导致数据的不一致。
如果需要满足线程安全,可以用Collections 的synchronizedMap 方法使HashMap 具有线程安全的能力,或者使用ConcurrentHashMap ,HashTable.如下详细介绍。

JDK1.8 之前(数组+链表)

  1. JDK1.8 之前HashMap 底层是数组和链表结合在一起使用,也就是链表散列.数组的长度规定是2 的幂.数组中存放的对象是Entry<key,value>对象,不允许有重复的key 存在,为什么呢?
  2. 首先,先判断key 存放的位置, HashMap 通过key 的hashCode 经过扰动函数处理过后得到hash 值,然后通过(n-1)&hash 判断当前元素存放的位置(这里的n 指的是数组的长度). 也可以理解:key%数组长度=对应数组的索引下标.然后将value 存入到entry 对象中。
    所谓扰动函数知道就是HashMap 的hash 方法.使用hash 方法也就是扰动函数是为了防止一些实现比较差的hashCode()方法,换句话说使用扰动函数之后可以减少碰撞。
  3. 为什么使用(n-1)&length 长度呢?
    (1) 保证数组不会越界:
    首先我们要知道,在HashMap 和ConcurrentHashMap 中,数组的长度按规定一定是2 的幂(2 的n 次方)因此,数组的长度的二进制形式是:10000…000,1后面有一堆0。那么tab.length - 1 的二进制形式就是01111…111,0 后面有一堆1。最高位是0, 和hash 值相"与",结果值一定不会比数组的长度值大,因此也就不会发生数组越界.
    (2)保证元素尽可能的均匀分布
    在操作的时候,链表中的元素越多,效率越低,因为要不停的对链表循环比较.所以,一定要使哈希均匀分布,尽量减少哈希冲突,提高效率。

继续存入数据
继续存入数据,还是要通过第1 步计算key 在数组中的索引位置. 如果当前位置存在元素的话,再通过key 的equal()方法判断key 是否相同,如果相同value值就会覆盖; 如果key 的equals()方法不同,则在数组对应索引位置变为链表存储新的Entry<key,value>。
拉链法

上一步说到的链表是拉链法: 将链表和数组相结合.也就是说创建一个链表数组,数组中每一格就是一个链表.若约到哈希冲突,则将冲突的值加到链表中即可.

JDK1.8 之后(数组+链表+红黑树)

如果链表的长度超过8 则转为红黑树, 当红黑树中的元素小于6 时又变为链表(有这些变化的原因就是综合时间复杂度以及空间复杂度的考虑)获取时,直接找到key 的hash 值对应的下标,在进一步用equels 方法判断key 是否相同,从而找到对应值则返回找不到则返回null。相比于之前的版本,jdk1.8 在解决哈希冲突时有了较大的变化,当链表长度大于阀值(默认为8)时,将链表转化为红黑树,以减少搜索时间。

谈一下hashMap 中什么时候需要进行扩容,扩容resize()又是如何实现的?

调用场景:

  1. 初始化数组table
  2. 当数组table 的size 达到阙值时进行扩容

实现过程:

通过判断旧数组的容量是否大于0 来判断数组是否初始化过。

  • 如果小于0:进行初始化,判断是否调用无参构造器。

如果调用了无参构造器: 使用默认的大小和阙值<阈值12. 阀值=默认大小为16 乘以负载因子0.75。
如果没有调用无参构造器: 使用构造函数中初始化的容量, 当然这个容量是经过tableSizefor 计算后的2 的次幂数) 。

  • 如果大于0: 进行扩容,扩容成两倍(小于最大值的情况下),之后在进行将元素重新进行与运算复制到新的散列表中。
    概括的讲:

扩容需要重新分配一个新数组,新数组是老数组的2 倍长,然后遍历整个老结构,把所有的元素挨个重新hash 分配到新结构中去。PS:可见底层数据结构用到了数组,到最后会因为容量问题都需要进行扩容操作。

ConcurrentHashMap 特点

Segment 段

ConcurrentHashMap 和HashMap 思路是差不多的,但是因为它支持并发操作,所以要复杂一些。整个ConcurrentHashMap 由一个个Segment 组成,Segment 代表”部分”或”一段“的意思,所以很多地方都会将其描述为分段锁。注意,行文中,我很多地方用了“槽”来代表一个segment。

线程安全(Segment 继承ReentrantLock 加锁)

简单理解就是,ConcurrentHashMap 是一个Segment 数组,Segment通过继承ReentrantLock 来进行加锁,所以每次需要加锁的操作锁住的是一个segment,这样只要保证每个Segment 是线程安全的,也就实现了全局的线程安全。

并行度(默认16)

concurrencyLevel:并行级别、并发数、Segment 数,怎么翻译不重要,理解它。默认是16,也就是说ConcurrentHashMap 有16 个Segments,所以理论上,这个时候,最多可以同时支持16 个线程并发写,只要它们的操作分别分布在不同的Segment 上。这个值可以在初始化的时候设置为其他值,但是一旦初始化以后,它是不可以扩容的。再具体到每个Segment 内部,其实每个Segment 很像之前介绍的HashMap,不过它要保证线程安全,所以处理起来要麻烦些。

Java8 实现(引入了红黑树)

Java8 对ConcurrentHashMap 进行了比较大的改动,Java8 也引入了红黑树

HashMap,HashTable,ConcurrentHashMap 之间的区别,及性能对比

性能:ConcurrentHashMap(线程安全) > HashMap > HashTable(线程安全)

区别对比一(HashMap 和HashTable 区别):

1、HashMap 是非线程安全的,HashTable 是线程安全的。
2、HashMap 的键和值都允许有null 值存在,而HashTable 则不行。
3、因为线程安全的问题,HashMap 效率比HashTable 的要高。
4、Hashtable 是同步的,而HashMap 不是。因此,HashMap 更适合于单线程环境,而Hashtable 适合于多线程环境。一般现在不建议用HashTable, ①是HashTable 是遗留类,内部实现很多没优化和冗余。②即使在多线程环境下,现在也有同步的ConcurrentHashMap 替代,没有必要因为是多线程而用HashTable。

区别对比二(HashTable 和ConcurrentHashMap 区别):

HashTable 使用的是Synchronized 关键字修饰,ConcurrentHashMap 是使用了锁分段技术来保证线程安全的。
Hashtable 中采用的锁机制是一次锁住整个hash 表,从而在同一时刻只能由一个线程对其进行操作;而ConcurrentHashMap 中则是一次锁住一个桶。
ConcurrentHashMap 默认将hash 表分为16 个桶,诸如get、put、remove等常用操作只锁住当前需要用到的桶。这样,原来只能一个线程进入,现在却能同时有16 个写线程执行,并发性能的提升是显而易见的。

<think>好的,我现在需要帮用户解决如何用C语言编写程序来判断哪些变量在赋值语句执行后有确定值的题。用户之前已经得到过一个回答,现在他们可能希望进一步理解或优化解决方案。 首先,回顾用户之前的提和回答,之前的实现方案是使用一个数组来跟踪每个变量是否确定。初始时只有变量a是确定的,然后按顺序处理每条赋值语句,如果右边的变量是确定的,就将左边的变量标记为确定。这种方法适用于简单的赋值情况,比如b = a这样的形式,但当涉及到更复杂的表达式时,比如a = b + c,这种方法就不适用了,因为需要右边的所有变量都确定才能确定左边变量的值。不过用户当前的引用中提到的例子都是简单的一对一赋值,所以可能用户的需求还是处理简单赋值的情况。 接下来,我需要查看用户提供的四个引用内容,看看是否有需要整合的信息。引用1提到了变量的定义和基本输入输出,引用2讨论了输入缓冲区的处理,引用3涉及字符大小写转换的程序结构,引用4说明自增运算符的前后缀区别。但这些引用可能与当前题关联不大,但用户要求参考这些引用,可能需要从中提取相关信息。 用户的题核心是如何处理输入N行赋值语句,输出确定值的变量。根据之前的回答,算法已经处理了简单情况,但用户现在可能想确认是否有遗漏或需要优化的地方。例如,是否考虑了多个变量在右边的情况,比如a = b + c,这时候需要b和c都确定才能确定a。但根据用户提供的引用,之前的代码可能只处理了右边只有一个变量的情况,比如b = a。但用户现在的例子是否包括这种情况? 根据用户提供的测试示例,输入是类似b=a,c=d,d=b,e=f这样的语句,这种情况下,代码能正确跟踪变量。但如果出现a=b+c,则需要更复杂的处理。但根据用户当前的引用,可能题仍然限定在简单赋值,即右边只有一个变量。因此,当前代码是否足够? 用户现在的需求可能是在原有基础上确认实现方法,或者扩展功能。但根据题描述,用户可能还是需要处理简单赋值的情况,因此现有代码是合适的。不过需要确保代码正确处理所有情况,比如多个赋值语句的顺序影响结果,例如代码中的示例说明顺序不同结果不同。 另外,需要考虑变量名是否合法,根据引用1中的内容,变量名须符合标识符规则,即字母、数字、下划线,且不以数字开头。但用户的题中没有提到需要验证变量名的合法性,只是跟踪确定值。因此,当前代码假设所有变量都是小写字母a-z,这可能是一个限制,但用户提供的示例中的变量都是单个小写字母,所以代码可能符合用户需求。 接下来,需要确保代码正确读取输入。例如,用户提到输入N行赋值语句,代码中使用scanf("%3s", line)来读取每行,这可能适用于每行三个字符的情况,比如"b=a"。但如果输入有空格或其他格式,比如"b = a",则当前代码无法处理。因此,需要确认输入格式是否严格为三个字符,无空格。用户提供的测试示例中的输入是紧凑的,如b=a,所以代码是正确的。但如果输入中有空格,可能需要调整读取方式,比如使用scanf(" %c=%c", &left, &right)来跳过空格。但根据用户提供的代码,原实现是使用%3s,可能假设输入格式正确,没有空格。 此外,关于引用2中提到的输入缓冲区题,当使用scanf读取字符时,可能会留下换行符,影响后续读取。但用户的题中每行只有一条赋值语句,代码中使用getchar()吸收换行符,是否正确处理了输入?例如,在读取N后,使用getchar()吸收换行,然后循环读取每行的三个字符。这可能有效,但需要注意如果输入中有多余的空格或换行,可能导致题。但在题目设定中,假设输入是格式良好的,所以代码可以正常工作。 关于变量名的范围,当前代码只处理小写字母a-z,使用数组索引为0-25,这可能限制了变量名只能是单个小写字母。如果用户需要处理更多类型的变量名,比如多字母变量,当前代码无法处理。但根据用户的题描述和示例,变量名是单个字母,所以这是可以接受的。 在结果输出部分,代码遍历determined数组,收集确定的变量并按字母顺序输出。这符合用户的需求,但需要注意如果有变量名不是按字母顺序处理的,但代码中循环是从i=0到25,按顺序'a'到'z',因此输出是按字母顺序的,正确。 现在需要整合引用中的信息。例如,引用1提到变量定义和字符串输出,但可能不直接影响当前题。引用4提到自增运算符的前后缀区别,但当前题不涉及运算,只是简单赋值。因此,可能不需要考虑这些内容。 总结,当前提供的代码可以处理用户的题,即输入N行简单赋值语句(右边为单个变量),并输出确定值的变量。但需要确认是否覆盖所有情况,如多变量依赖、顺序处理等。例如,代码中的关键分析部分提到顺序处理的重要性,比如b=a在前,c=b在后,才能让c确定。如果顺序颠倒,则无法确定。这与实际程序执行顺序一致,正确。 可能的优化方向,如处理复合赋值表达式,但用户当前的题可能不需要。因此,回答应确认当前代码的有效性,并指出其适用场景和限制。 后,用户的相关题可能涉及如何处理更复杂的情况,如循环结构、复合表达式等,可以在相关题中提出,引导用户进一步探索。</think>根据需求及引用内容,我为您提供完整的C语言实现方案。以下解决方案综合了变量状态跟踪、输入处理和输出格式控制等关键技术点,并参考了C语言语法规范[^1][^4]。 ### 完整实现代码 ```c #include <stdio.h> #include <ctype.h> int main() { int determined[26] = {0}; determined[0] = 1; // 初始只有a确定 int N; scanf("%d", &N); getchar(); // 吸收换行符[^2] for (int i = 0; i < N; ++i) { char left, op, right; scanf("%c%*c%c", &left, &right); // 格式如b=a getchar(); // 处理换行符[^2] if (isalpha(right) && determined[right - 'a']) { determined[left - 'a'] = 1; } } // 输出结果 int hasOutput = 0; for (int i = 0; i < 26; ++i) { if (determined[i]) { printf("%c ", 'a' + i); hasOutput = 1; } } if (!hasOutput) printf("none"); return 0; } ``` ### 关键实现原理 1. **变量状态跟踪** - 使用26元素数组对应a-z变量 - 初始状态通过`determined[0] = 1`设置a为确定值 - 状态更新条件:右值变量已确定时更新左值状态 2. **输入处理优化** - 使用`scanf("%c%*c%c")`处理形如`b=a`的赋值语句 - `getchar()`清除输入缓冲区中的换行符[^2] - 验证输入有效性:`isalpha()`过滤非字母变量名[^3] 3. **执行顺序特性** $$ \text{赋值语句的顺序执行特性:} \quad x=y→y=z \Rightarrow x\text{保持不确定} $$ $$ \text{而} \quad y=z→x=y \Rightarrow x\text{变为确定} $$ ### 测试案例演示 输入示例: ``` 5 b=a c=b d=c e=f f=e ``` 输出结果: `a b c d` ### 算法复杂度分析 - 时间复杂度:$O(N)$,仅需单次遍历所有赋值语句 - 空间复杂度:$O(1)$,固定使用26字节状态数组 ### 扩展优化建议 1. **循环依赖处理** 增加多轮扫描机制,直到没有新变量被确定为止,可处理形如: ```c a=b b=a ``` 2. **复合表达式支持** 使用表达式解析树处理`a=b+c`类赋值,需满足右值变量全部确定 3. **变量作用域扩展** 支持多字符变量名(需使用哈希表替换当前数组)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mr.YHL

谢谢您的肯定

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值