HashSet和TreeSet的比较

本文深入探讨了HashSet和TreeSet两种Java集合类的底层实现原理。HashSet基于哈希表,不保证顺序,允许插入基本数据类型但不允许重复对象,通过重写hashcode()和equals()方法来判断对象重复。TreeSet基于二叉树排序,提供了自然排序和定制排序功能,通过实现Comparable接口或使用Comparator接口来控制排序规则。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

hashset:底层数据结构是哈希表,不保证顺序,是不同步的
hashset在插入对象类型的时候,默认可以重复(属性值完全相同的对象),只有重写实体类的hashcode()和equals()方法后才可以防止插入重复对象。首先通过hashcode()判断要插入对象的hashcode是否与set中已有对象相等,如果没有相等的则为不同的对象可以插入set,如果有相等则继续通过equals()比较两个对象的每个属性是否完全相等,如相等则

为重复对象,不能插入。

hashset在插入基本数据类型的时候不能插入重复值。


TreeSet:底层是二叉树排序的,可以给Set集合中的元素进行指定顺序
的排序,非同步的。
自然排序:
1, 让实现类 实现接口: Comparable , 泛型: 要排序的实体类
2, 重写方法, compareTo()
0: 代表相同的元素, 不添加到TreeSet中

非0: 则需要添加到集合中

return -1; 从大到小排列


定制排序
1,  定义一个类, 实现Comparator接口,  -- 自定义比较器
2,  重写方法, compare() 
3,  创建一个TreeSet对象时, 把自定义的比较器, 放入到TreeSet的比较器中

### Hashset vs Treeset 特性及使用场景 #### 1. 数据结构基础 HashSet 是基于哈希表(Hash Table)实现的集合,内部利用 HashMap 实现存储功能。它不允许重复元素,并提供常数时间复杂度的插入、删除查找操作[^1]。相比之下,TreeSet 使用红黑树(Red-Black Tree)作为底层数据结构,能够自动维护元素的自然顺序或由 Comparator 定义的自定义顺序[^2]。 --- #### 2. 时间复杂度对比 | **操作** | **HashSet** | **TreeSet** | |----------------|--------------------------------|------------------------------| | 插入 | O(1) | O(log n) | | 删除 | O(1) | O(log n) | | 查找 | O(1) | O(log n) | 由于 HashSet 不关心元素的顺序,因此其性能优于需要排序的 TreeSet。然而,在某些情况下,如需保持元素有序,则必须选用 TreeSet[^3]。 --- #### 3. 序列化与线程安全性 两者都不具备内在的线程安全性。如果在多线程环境下使用这些集合类,应采取外部同步措施或其他并发集合替代方案。另外,二者都实现了 Serializable 接口,这意味着它们可以被序列化以便在网络上传输或持久化到磁盘上[^4]。 --- #### 4. 初始化容量的重要性 对于 HashSet 而言,适当地设置初始容量有助于减少因动态扩展而导致的时间开销。例如: ```java Set<String> optimalHashSet = new HashSet<>(expectedSize); ``` 而 TreeSet 并不需要类似的优化手段,因为它始终维持着平衡二叉搜索树的状态[^3]。 --- #### 5. 使用场景分析 ##### (1)适用 HashSet 的场景 - 对元素访问速度有较高要求; - 不关注元素间的相对次序; - 需要高效处理大数据量且无需保留任何特定排列方式的数据集。 示例代码展示如何快速构建一个去重列表: ```java import java.util.HashSet; import java.util.Set; public class Main { public static void main(String[] args) { Set<Integer> uniqueNumbers = new HashSet<>(); uniqueNumbers.add(10); uniqueNumbers.add(20); System.out.println(uniqueNumbers.contains(10)); // true } } ``` ##### (2)适合 TreeSet 的场合 - 必须保证集合中的项目按升序降序或者其他定制规则呈现出来; - 进行区间检索时效率更高,比如找出所有介于两个数值之间的成员。 下面的例子演示了如何创建并迭代一个从小到大排列整型对象的容器: ```java import java.util.TreeSet; import java.util.Set; public class Main { public static void main(String[] args) { Set<Double> sortedValues = new TreeSet<>(); sortedValues.add(98.6); sortedValues.add(-7.3); for (double value : sortedValues){ System.out.println(value); } //-7.3, then 98.6 printed on separate lines. } } ``` --- #### 结论 选择哪种类型的 Set 主要是看应用的具体需求是什么样的。如果只是简单地想要获得唯一性的保障加上极高的运算效能就选 HashSet;若是还额外追求某种固定的布局样式则应该倾向采用 TreeSet[^2]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值