map 容器学习 -- hashMap

本文深入探讨HashMap如何解决关联元素对应关系的问题,通过分析其内部结构(数组+链表+红黑树),阐述扩容机制及线程安全性问题,帮助读者理解HashMap的工作原理。

  map是一种常见的容器 ,此篇简单记载学习后的一些心得

第一个问题:map这种结构是用来解决什么样的问题? 

看这样一个例子:假如我们希望将一些人名字的信息存储起来,首先我们想到使用数组存储这些元素

String [] names  = new String [10];

names[0] = "张三";

names[1] = "李四";

//...

接下来我们需要存储每个人的身份证号 怎么做?可以把人简单封装成对象放入数组 

People zhangsan = new People("张三","11051xxxxxxxx");

People lisi = new People("李四","11051xxxxxxxx");

这时候我们需要查询 11051xxxxxxxx的身份证号是谁要做么做 ? 遍历数组取出每个人的身份证号进行比较才能得到结果。这个算法是非常低效的 ,运行时间最坏为O(n) ,那我们怎么解决这个问题 。我们需要的是一种能表示关联元素对应关系的数据结构 map就为我们解决了这个问题 接下来介绍 本篇的主角hashMap

让我们按照这样的思路去探寻 它能解决什么问题-》它是怎么实现的-》优缺点来看看下面的几个容器

hashMap:首先hashMap 就能解决我们上面的问题,为什么呢?

hashMap使用hashtable搜索在理想情况下执行时间为远远大于 Array

关于hashtable的算法不了解的朋友可以自行百度

hashMap 是怎么实现的呢 ? 让我们直接看源码

hashMap的所有属性都在这里能作为容器的只有 table 和 entrySet 两个属性是集合,那我们就看看到底是哪个容器

我们通过代码可以看到它是确实存放在我们的table 属性中了  说明table就是承载我们元素的容器 那么table是什么?

通过源代码我们可知就是数组+链表构成 (1.8之后加入了红黑树)

put 方法中:

将获取的index存入数组中,数组中则存放一个链表。

get 方法中:

 

map的存储模型如下:

这里写图片描述

从模型中我们可以看出每条链表的长度将是制约查询速度的主要问题,当我们通过key计算出index后需要遍历每个链表节点的数据得到结果。 假如数据量比较大的情况可能会出现链表都比较长的问题,这个问题hashMap 是怎么解决的呢 扩容

假如1000条数据我们的hashMap的数组长度为10时 我们期望的每个链表长度则为100 当我们扩展到200时 则每条链表的长度期望就是5,这种扩容方案是1.7之前的主要解决方案,1.8则使用红黑树来彻底解决这个问题。

让我们来看看hashMap是如何进行扩容的 这里面用于判断的threshold的值为数组长度的0.75 初始值为12 

扩容也会带来很大的问题。扩容后会将之前的全部元素重新计算存入扩容后的hashMap会耗费大量资源

最后简单说说我们的hashMap的缺点:线程不安全

总结就到这里欢迎大家指正问题 !!  与君共勉

 

### C++ 中 HashMap 的使用方法 在 C++ 标准库中,`std::unordered_map` 是实现哈希表的标准容器之一。它的功能类似于 `HashMap`,提供了键值对存储的功能,并支持快速查找、插入和删除操作。 #### 基本语法 以下是 `std::unordered_map` 的基本用法: ```cpp #include <iostream> #include <unordered_map> int main() { // 创建一个 unordered_map 对象 std::unordered_map<int, std::string> myMap; // 插入元素 myMap[1] = "Apple"; myMap[2] = "Banana"; // 查找元素 if (myMap.find(1) != myMap.end()) { std::cout << "Key 1 found with value: " << myMap[1] << std::endl; } // 遍历 map for (const auto& pair : myMap) { std::cout << "Key: " << pair.first << ", Value: " << pair.second << std::endl; } // 删除元素 myMap.erase(2); return 0; } ``` 上述代码展示了如何创建、插入、查找和遍历 `std::unordered_map`[^2]。 --- ### 如何在 PTA 平台上进行检索 PTA(Programming Teaching Assistant)是一个在线评测平台,主要用于学生提交编程作业并获得自动评分反馈。要在 PTA 上找到特定类型的题目或练习集,可以按照以下方式操作: 1. **访问官网** 打开浏览器输入地址 https://pintia.cn/ 登录账号进入首页。 2. **浏览分类目录** 在页面顶部导航栏下拉菜单中有多个选项卡可供选择,比如“考试”、“练习”。点击这些标签能够看到更详细的子项列表[^3]。 3. **搜索框定位目标资源** 利用右上角全局搜索引擎直接输入关键词如“哈希表应用”,即可过滤显示相关内容链接跳转至具体描述界面查看详细需求说明文档。 4. **按难度筛选试题** 用户还可以依据个人学习进度挑选适合自己的挑战等级——初级(Basic Level),进阶版(Advanced Level),乃至顶级(Top Level)。 --- ### 结合实例分析 假设现在有一道来自 PTA 的典型例题:“统计字符串中的字符频率。” 可以采用前面提到过的 hash 表来高效解决该类问题。下面给出一种可能的解决方案思路及其对应的源码片段作为参考: 给定两个字符串 A 和 B,请找出只存在于 A 字符串而不在 B 字符串里的那些字母组合打印出来。 解法伪逻辑: - 初始化辅助数组记录B里各ASCII编码对应位置上的计数值; - 遍历读取每一个属于A的部分单元格判断其是否满足条件输出相应结果; 实际编写如下所示版本程序即实现了这一目的[^1]: ```cpp #include <bits/stdc++.h> using namespace std; int s[1001]; int main(){ string a,b; getline(cin,a); getline(cin,b); for(int i=0;b[i]!='\0';i++) s[b[i]]++; // 记录 b 中每个字符出现次数 for(int i=0;a[i]!='\0';i++){ if(!s[a[i]]) cout<<a[i]; } return 0; } ``` 此段落解释了如何运用简单的整型数组模拟 hashmap 功能完成任务处理流程演示。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值