4.9.4 HashMap、HashTable、TreeMap和WeakHashMap有哪些区别
Java为数据结构中的映射定义了一个接口java.util.Map,它包括三个实现类:HaspMap、HashTable、和TreeMap。Map是用来存储键值对的数据结构,在数组中通过数组下标来对其内容索引的,而在Map中,则是通过对象来进行索引,用来索引的对象叫做key,其对应的对象叫做value。
HashMap是一个最常用的Map,它根据键的HashCode值存储数据,根据键可以直接获取它的值,具有很快的访问速度。由于HashMap与HashTable都采用了hash法进行索引,因此二者有许多相似之处,主要有如下区别:
1>HashMap是HashTable的轻量级实现(非线程安全的实现),他们都完成了Map接口,主要区别在于HashMap允许空(null)键值(key)(但是最多只允许一条记录的键为null,不允许多条记录的值为null),而HashTable不允许。
2>HashMap把HashTable的contains方法去掉了,改成containsvalue和containsKey,因为contains方法容易让人引起误解。HashTable继承自Dictionary类,而HashMap是Java1.2引进的Map interface的一个实现。
3>HashTable的方法是线程安全的,而HashMap不支持线程的同步,所以它不是线程安全的。在多个线程访问HashTable时,不需要开发人员对它进行同步,而对于HashMap,开发人员必须提供额外的同步机制。所以,就效率而言,HashMap可能高于HashTable。
4>HashTable使用Enumeration,HashMap使用Iterator。
5>HashTable和HashMap采用的 hash/rehash算法几乎都一样,所以性能不会有很大的差异。
6>在HashTable中,hash数组默认的大小是11,增加的方式是old*2+1。在HashMap中,hash数组的默认大小是16,而且一定是2的指数。
7>hash值的使用不同,HashTable直接使用对象的hashCode。
以上三种类型中,使用最多的是HashMap。HashMap里面存入的键值对在取出时没有固定的顺序,是随机的。一般而言,在Map中插入、删除和定位元素,HashMap是最好的选择。由于TreeMap实现了SortMap接口,能够把它保存的记录根据键排序,因此,取出来的是排序后的键值对,如果需要按自然顺序或自定义顺序遍历键, 那么TreeMap会更好。LinkedHashMap是HashMap的一个子类,如果需要输出的顺序和输入的相同,那么用LinkedHashMap可以实现,它还可以按读取顺序来排列。
WeakHashMap与HashMap类似,二者的不同之处在于WeakHashMap中Key采用的是”弱引用”的方式,只要WeakHashMap中的key不再被外部引用,他就可以被垃圾回收器回收。而HashMap中Key采用的是”强引用的方式”,当HashMap中的key没有被外部引用时,只有在这个key从HashMap中删除后,才可以被垃圾回收器回收。
引申:
1.在HashTable上下文中,同步指的是什么?
答:同步意味着在一个时间点只能有一个线程可以修改hash表,任何线程在执行HashTable的更新操作前都需要获取对象锁,其他线程则等待锁的释放。
2.如何实现HashMap的同步?
答:HashMap可以通过Map m = Collections.synchronizedMap(new HashMap())来达到同步的效果。具体而言,该方法返回一个同步的Map,该Map封装了底层的HashMap的所有方法,使得底层的HashMap即使是在多线程的环境中也是安全的。
4.9.5用自定义作为HashMap或HashTable的key需要注意哪些问题
HashMap与HashTable是用来存放键值对的一种容器,在使用这两个容器时有一个限制:不能用来存储重复的键。也就是说,每个键只能唯一映射一个值,当有重复的键时,不会创建新的映射关系,而会使用先前的value值。为了更好的说明这个问题,我们首先来看一段示例的代码:
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;
class People{
private String id;
private String name;
public People(String id,String name){
this.id = id;
this.name = name;
}
public String toString(){
return "id= "+id+" ,name= "+name;
}
}
public class TestMap {
public static void test1(){
System.out.println("Use String key:");
HashMap<String,String> hm = new HashMap<String,String>();
hm.put("aaa", "bbb");
hm.put("aaa","ccc");
Iterator iter = hm.entrySet().iterator();
while(iter.hasNext())
{
@SuppressWarnings("rawtypes")
Map.Entry entry = (Map.Entry) iter.next();
String key = (String) entry.getKey();
String val = (String) entry.getValue();
System.out.println(key+" "+val);
}
}
public static void main(String[] args){
test1();
}
}
运行结果:
Use String key:
aaa ccc
从上面的例子可以看出,首先向HashMap中添加<”aaa”,”bbb”>,接着添加<”aaa”,”ccc”>的时候由于与前面已经添加过的数据有相同的key:”aaa”,因此会用新的值”ccc”替换”bbb”。
但当用自定义的类的对象作为HashMap的Key时,有时候会给人造成一种假象-key是可以重复的,示例如下:
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;
class People{
private String id;
private String name;
public People(String id,String name){
this.id = id;
this.name = name;
}
public String toString(){
return "id= "+id+",name= "+name;
}
}
public class TestMap {
public static void test1(){
System.out.println("Use user defined class key:");
HashMap<People,String> hm = new HashMap<People,String>();
People people1 = new People("111","name1");
People people2 = new People("111","name1");
hm.put(people1,"address1");
hm.put(people2,"address2");
Iterator iter = hm.entrySet().iterator();
while(iter.hasNext())
{
@SuppressWarnings("rawtypes")
Map.Entry entry = (Map.Entry) iter.next();
People key = (People) entry.getKey();
String val = (String) entry.getValue();
System.out.println("key: "+key+" value: "+val);
}
}
public static void main(String[] args){
test1();
}
}
运行结果:
Use user defined class key:
key: id= 111,name= name1 value: address2
key: id= 111,name= name1 value: address1
从表面上看,向HashMap中添加的两个键值对的key值是相同的,可是为什么在后面添加的键值对没有覆盖前面的value呢?为了说明这个问题,下面首先介绍HashMap添加元素的操作过程。具体而言,在想HashMap中添加键值对
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;
class People{
private String id;
private String name;
public int hashCode(){
return id.hashCode();
}
public People(String id,String name){
this.id = id;
this.name = name;
}
public String toString(){
return "id= "+id+",name= "+name;
}
public boolean equals(Object obj){
People p = (People)obj;
if(p.id.equals(this.id)){
return true;
}else
return false;
}
}
public class TestMap {
public static void test2(){
System.out.println("Use user defined class key:");
HashMap<People,String> hm = new HashMap<People,String>();
People people1 = new People("111","name1");
People people2 = new People("111","name2");
hm.put(people1,"address1");
hm.put(people2,"address2");
@SuppressWarnings("rawtypes")
Iterator iter = hm.entrySet().iterator();
while(iter.hasNext())
{
@SuppressWarnings("rawtypes")
Map.Entry entry = (Map.Entry) iter.next();
People key = (People) entry.getKey();
String val = (String) entry.getValue();
System.out.println("key: "+key+" value: "+val);
}
}
public static void main(String[] args){
test2();
}
}
运行结果:
Use user defined class key:
key: id= 111,name= name1 value: address2
由此可以看出,开发者在使用自定义类作为HashMap的key时,需要注意以下几个问题:
1)如果想根据对象的相关属性来自定义对象是否相等的逻辑,此时就需要重写equals()方法,一旦重写了equals()方法,那么就必须重写hashCode()方法。
2)当自定义类的多项作为HashMap(HashTable)的key时,最好把这个类设计为不可变类
3)从HashMap的工作原理可以看出,如果两个对象相等,那么这两个对象有着相同的hashCode,反之则不成立。
4.9.6 Collection和Collections有什么区别
Collection是一个集合接口。它提供了对集合对象进行基本操作的通用接口方法。实现该接口的类主要List和Set,该接口的设计目标是为各种具体的集合提供最大化的统一的操作方式。
Collections是针对集合类的一个包装类,它提供了一系列静态方法以实现对各种集合的搜索、排序、线程安全化等操作,其中大多数方法都用来处理线性表。Collections类不能实例化,如同一个工具类,服务于Collection框架。若使用Collections类的方法时,对应的Collection的对象为null,则这些方法都会抛出nullPointerException。
使用Collections的示例如下:
import java.util.* ;
public class TestCollections {
public static void main(String[] args){
List<Integer>list = new LinkedList<Integer>();
int array[] = {1,7,3,2};
for(int i=0;i < array.length;i++){
list.add(new Integer(array[i]));
}
Collections.sort(list);
for(int i=0;i<list.size();i++){
System.out.println(list.get(i));
}
}
}
运行结果:
1
2
3
7