C#中Hashtable、Dictionary详解以及写入和读取对比

本文探讨了HashTable和Dictionary的构造原理及实现方式,并通过代码实验对比了两者在不同数据规模下的插入与读取效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在本文中将从基础角度讲解HashTable、Dictionary的构造和通过程序进行插入读取对比。

一:HashTable

1.HashTable是一种散列表,他内部维护很多对Key-Value键值对,其还有一个类似索引的值叫做散列值(HashCode),它是根据GetHashCode方法对Key通过一定算法获取得到的,所有的查找操作定位操作都是基于散列值来实现找到对应的Key和Value值的。

2.我们需要使用一个算法让散列值对应HashTable的空间地址尽量不重复,这就是散列函数(GetHashCode)需要做的事。

3.当一个HashTable被占用一大半的时候我们通过计算散列值取得的地址值可能会重复指向同一地址,这就是哈希冲突。

在.Net中键值对在HashTable中的位置Position= (HashCode& 0x7FFFFFFF) % HashTable.Length,.net中是通过探测法解决哈希冲突的,当通过散列值取得的位置Postion以及被占用的时候,就会增加一个位移x值判断下一个位置Postion+x是否被占用,如果仍然被占用就继续往下位移x判断Position+2*x位置是否被占用,如果没有被占用则将值放入其中。当HashTable中的可用空间越来越小时,则获取得到可用空间的难度越来越大,消耗的时间就越多。

4.当前HashTable中的被占用空间达到一个百分比的时候就将该空间自动扩容,在.net中这个百分比是72%,也叫.net中HashTable的填充因子为0.72。例如有一个HashTable的空间大小是100,当它需要添加第73个值的时候将会扩容此HashTable.

5.这个自动扩容的大小是多少呢?答案是当前空间大小的两倍最接近的素数,例如当前HashTable所占空间为素数71,如果扩容,则扩容大小为素数131.


二:Dictionary

1.Dictionary是一种变种的HashTable,它采用一种分离链接散列表的数据结构来解决哈希冲突的问题。

2.分离链接散列表是当散列到同一个地址的值存为一个链表中。

3.这个变种HashTable的填充因子是1

三:本文将以代码的形式探索HashTable和Dictionary的插入和三种读取方式的效率(for/foreach/GetEnumerator)

public class HashTableTest 
    { 
        static Hashtable _Hashtable; 
        static Dictionary<string, object> _Dictionary; 
        static void Main() 
        { 
            Compare(10); 
            Compare(10000); 
            Compare(5000000); 
            Console.ReadLine(); 
        } 
        public static void Compare(int dataCount) 
        { 
            Console.WriteLine("-------------------------------------------------\n"); 
            _Hashtable = new Hashtable(); 
            _Dictionary = new Dictionary<string, object>(); 
            Stopwatch stopWatch = new Stopwatch(); 
            //HashTable插入dataCount条数据需要时间 
            stopWatch.Start(); 
            for (int i = 0; i < dataCount; i++) 
            { 
                _Hashtable.Add("Str" + i.ToString(), "Value"); 
            } 
            stopWatch.Stop(); 
            Console.WriteLine(" HashTable插入" + dataCount + "条数据需要时间:" + stopWatch.Elapsed); 
    
            //Dictionary插入dataCount条数据需要时间 
            stopWatch.Reset(); 
            stopWatch.Start(); 
            for (int i = 0; i < dataCount; i++) 
            { 
                _Dictionary.Add("Str" + i.ToString(), "Value"); 
            } 
            stopWatch.Stop(); 
            Console.WriteLine(" Dictionary插入" + dataCount + "条数据需要时间:" + stopWatch.Elapsed); 
    
            //Dictionary插入dataCount条数据需要时间 
            stopWatch.Reset(); 
            int si = 0; 
            stopWatch.Start(); 
            for(int i=0;i<_Hashtable.Count;i++) 
            { 
                si++; 
            } 
            stopWatch.Stop(); 
            Console.WriteLine(" HashTable遍历时间:" + stopWatch.Elapsed + " ,遍历采用for方式"); 
    
            //Dictionary插入dataCount条数据需要时间 
            stopWatch.Reset(); 
            si = 0; 
            stopWatch.Start(); 
            foreach (var s in _Hashtable) 
            { 
                si++; 
            } 
            stopWatch.Stop(); 
            Console.WriteLine(" HashTable遍历时间:" + stopWatch.Elapsed + " ,遍历采用foreach方式"); 
    
            //Dictionary插入dataCount条数据需要时间 
            stopWatch.Reset(); 
            si = 0; 
            stopWatch.Start(); 
            IDictionaryEnumerator _hashEnum = _Hashtable.GetEnumerator(); 
            while (_hashEnum.MoveNext()) 
            { 
                si++; 
            } 
            stopWatch.Stop(); 
            Console.WriteLine(" HashTable遍历时间:" + stopWatch.Elapsed + " ,遍历采用HashTable.GetEnumerator()方式"); 
    
            //Dictionary插入dataCount条数据需要时间 
            stopWatch.Reset(); 
            si = 0; 
            stopWatch.Start(); 
            for(int i=0;i<_Dictionary.Count;i++) 
            { 
                si++; 
            } 
            stopWatch.Stop(); 
            Console.WriteLine(" Dictionary遍历时间:" + stopWatch.Elapsed + " ,遍历采用for方式"); 
    
            //Dictionary插入dataCount条数据需要时间 
            stopWatch.Reset(); 
            si = 0; 
            stopWatch.Start(); 
            foreach (var s in _Dictionary) 
            { 
                si++; 
            } 
            stopWatch.Stop(); 
            Console.WriteLine(" Dictionary遍历时间:" + stopWatch.Elapsed + " ,遍历采用foreach方式"); 
    
            //Dictionary插入dataCount条数据需要时间 
            stopWatch.Reset(); 
            si = 0; 
            stopWatch.Start(); 
            _hashEnum = _Dictionary.GetEnumerator(); 
            while (_hashEnum.MoveNext()) 
            { 
                si++; 
            } 
            stopWatch.Stop(); 
            Console.WriteLine(" Dictionary遍历时间:" + stopWatch.Elapsed + " ,遍历采用Dictionary.GetEnumerator()方式"); 
    
    
            Console.WriteLine("\n-------------------------------------------------"); 
        } 
    }


四:从上面的结果可以看出

1.HashTable大数据量插入数据时需要花费比Dictionary大的多的时间。

2.for方式遍历HashTable和Dictionary速度最快。

3.在foreach方式遍历时Dictionary遍历速度更快。

五:在单线程的时候使用Dictionary更好一些,多线程的时候使用HashTable更好。

因为HashTable可以通过Hashtable tab = Hashtable.Synchronized(new Hashtable());获得线程安全的对象。

 

当然因为各自电脑的情况不一样,可能会有部分误差。如有问题,敬请斧正。

 

C# 中,`HashTable` `Dictionary<TKey, TValue>` 是两种用于存储键值对的集合类型,它们在功能、性能使用场景上存在显著差异。 ### 泛型支持 `Dictionary<TKey, TValue>` 是一个泛型集合,允许在声明时指定键值的具体类型,从而提供更强的类型安全性。相比之下,`HashTable` 是一个非泛型集合,可以存储任意类型的键值,但这也意味着在操作元素时通常需要进行类型转换[^1]。 ### 性能表现 由于 `Dictionary<TKey, TValue>` 的泛型特性,在处理值类型时避免了装箱拆箱操作,因此其性能通常优于 `HashTable`。而在 `HashTable` 中,当存储或检索值类型时,会自动执行装箱(将值类型转换为对象)拆箱(从对象恢复值类型)操作,这会导致额外的性能开销[^1]。 ### 线程安全 两者都不是线程安全的数据结构,但是 .NET Framework 提供了 `ConcurrentDictionary<TKey, TValue>` 作为 `Dictionary<TKey, TValue>` 的线程安全替代品。对于 `HashTable`,虽然也有一定的同步机制,但在多线程环境下推荐使用专门的并发集合以获得更好的性能安全性[^1]。 ### 排序能力 默认情况下,无论是 `HashTable` 还是 `Dictionary<TKey, TValue>` 都不保证内部元素的顺序。然而,`Dictionary<TKey, TValue>` 可以通过 `SortedDictionary<TKey, TValue>` 实现按键排序的功能。此外,在 .NET 3.5 及以上版本中引入 LINQ 后,对 `Dictionary<TKey, TValue>` 进行排序变得非常简便[^3]。 ### 键的唯一性空值支持 在这两个集合中,键都必须是唯一的。如果尝试添加重复的键,则会抛出异常。同时,两者均支持 `null` 作为键,前提是键的类型允许为引用类型或可空值类型。 ### 示例代码 下面展示了如何创建并使用 `Dictionary<TKey, TValue>` 与 `HashTable`: ```csharp // 使用 Dictionary<TKey, TValue> Dictionary<string, int> dictionary = new Dictionary<string, int>(); dictionary.Add("one", 1); dictionary.Add("two", 2); foreach (var pair in dictionary) { Console.WriteLine($"Key: {pair.Key}, Value: {pair.Value}"); } // 使用 Hashtable Hashtable hashtable = new Hashtable(); hashtable.Add("one", 1); hashtable.Add("two", 2); foreach (DictionaryEntry entry in hashtable) { Console.WriteLine($"Key: {entry.Key}, Value: {entry.Value}"); } ``` 综上所述,尽管 `HashTable` `Dictionary<TKey, TValue>` 都能够满足基本的键值对存储需求,但鉴于 `Dictionary<TKey, TValue>` 在类型安全性性能方面的优势,特别是在 .NET Framework 2.0 及更高版本中,推荐优先考虑使用 `Dictionary<TKey, TValue>` 来构建应用程序[^4]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值