705.设计哈希集合

不使用任何内建的哈希表库设计一个哈希集合

具体地说,你的设计应该包含以下的功能

  • add(value):向哈希集合中插入一个值。
  • contains(value) :返回哈希集合中是否存在这个值。
  • remove(value):将给定值从哈希集合中删除。如果哈希集合中没有这个值,什么也不做。

注意:

  • 所有的值都在 [1, 1000000]的范围内。
  • 操作的总数目在[1, 10000]范围内。
  • 不要使用内建的哈希集合库。

思路一:
该方法较为简单,但性能较差,根据题意创建百万级的数组,用于一一映射要插入的数值,尽管题目的值是从1开始,但是实际测试用例却包含了0,所以需要将数组赋值为-1,不然判断是否contains(0)时,就会报错!

class MyHashSet {

    private int[] arr;
    
    /** Initialize your data structure here. */
    public MyHashSet() {
        arr = new int[1000000];
        for(int i = 0; i < arr.length; i++){
            arr[i] = -1;
        }
    }
    
    public void add(int key) {
        arr[key] = key;
    }
    
    public void remove(int key) {
        if (arr[key] != key) {
			return;
		}else {
			arr[key] = -1;
		}
    }
    
    /** Returns true if this set did not already contain the specified element */
    public boolean contains(int key) {
        if (arr[key] == key) {
			return true;
		}
		return false;
    }
}

**思路二:**使用List和LinkedList实现一个散列表

### 什么是哈希集合 哈希集合(HashSet)是一种基于哈希表实现的数据结构,它允许存储唯一的元素而考虑顺序。由于其底层依赖于哈希表,因此哈希集合继承了哈希表的优点,例如高效的插入、删除和查找操作[^1]。 ### 哈希集合的核心概念 #### 1. **唯一性** 哈希集合一个重要特性是其中的元素必须是唯一的。这意味着如果尝试向哈希集合中添加一个已经存在的元素,则会成功[^2]。 #### 2. **无序性** 与数组或链表同,哈希集合中的元素是没有固定顺序的。这是因为元素的位置由它们对应的哈希值决定,而是按照插入顺序排列[^3]。 #### 3. **时间复杂度** 在理想情况下,哈希集合的操作(如插入、删除和查找)的时间复杂度接近 O(1),这得益于良好的哈希函数设计以及冲突解决机制的有效实施[^4]。 --- ### 哈希集合的实现细节 #### 1. **哈希函数的设计** 为了使哈希集合高效运行,需要设计一个好的哈希函数来将对象映射到特定的索引位置。理想的哈希函数应满足以下条件: - 尽量均匀分布:减少碰撞的可能性。 - 计算速度快:降低计算开销。 #### 2. **处理哈希冲突** 即使有优秀的哈希函数,仍然可能出现同的键被映射到同一个桶的情况,这种现象被称为哈希冲突。常用的解决方案包括: - 链地址法:每个桶维护一个链表或其他动态数据结构以保存多个项。 - 开放寻址法:当发生冲突时,在表中寻找下一个可用槽位。 以下是采用链地址法实现哈希集合的一种简单示例: ```python class MyHashSet: def __init__(self): self.size = 1000 # 初始大小 self.buckets = [[] for _ in range(self.size)] def add(self, key: int) -> None: bucket_index = key % self.size if not self.contains(key): # 如果存在才加入 self.buckets[bucket_index].append(key) def remove(self, key: int) -> None: bucket_index = key % self.size if self.contains(key): self.buckets[bucket_index].remove(key) def contains(self, key: int) -> bool: bucket_index = key % self.size return key in self.buckets[bucket_index] # 使用示例 hash_set = MyHashSet() hash_set.add(1) hash_set.add(2) print(hash_set.contains(1)) # 输出 True hash_set.remove(2) print(hash_set.contains(2)) # 输出 False ``` --- ### 哈希集合的应用场景 #### 1. **去重** 哈希集合常用于去除重复数据。例如,在统计一组数中有多少个独一无二的整数时,可以利用哈希集合作为辅助工具。 #### 2. **成员检测** 相比于其他数据结构(如列表),哈希集合提供了更快捷的方式来进行成员资格测试。这对于大规模数据尤为重要。 #### 3. **两数之和问题** 给定一个目标数值 target 和一系列数字 nums[] ,判断是否存在两个数相加等于 target 。此问题可以通过一次遍历结合哈希集合完成。 ```python def two_sum(nums, target): seen = set() # 创建一个空的哈希集合 for num in nums: complement = target - num if complement in seen: return (complement, num) seen.add(num) return None result = two_sum([2, 7, 11, 15], 9) if result: print(f"找到组合 {result}") else: print("未找到符合条件的组合") ``` --- ### 总结 哈希集合作为一种重要的抽象数据类型,凭借其实现上的灵活性和性能优势,在现代软件开发领域占据了一席之地。无论是作为独立组件还是与其他高级算法配合使用,掌握它的原理及应用场景都是程序员必备技能之一。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值