.Net 中HashTable，HashMap 和 Dictionary 和List和DataTable的比较

2021-08-29 07:14:09

参考资料

http://www.cnblogs.com/MichaelYin/archive/2011/02/14/1954724.html

http://zhidao.baidu.com/link?url=DonFgOvFddsAVKUjY4WBwCgE6cO4jLjapPS14Hb3iobC3f6QwYB-3R6OQkRArowg2vzxLnTiujkHss6iy2wFDq

http://www.cnblogs.com/lori/archive/2011/08/09/2132380.html

http://www.coding123.net/article/20120419/DataTable-IList-compare.aspx

首先：

(ling)在.Net 模仿java 的过程中抛弃了 HashMap ，所以以后再去面试.Net的时候当别人问你HashTable 和HashMap 的区别的时候，请告诉他，C#.Net 中没有HashMap

好接下来进入正题

.Net 中HashTable 和 Dictionary<key,value> 和List<T>的比较（不要问我怎么和题目不一样），本文只比较两种数据类型在使用时功能相近的情况，差别太大的则不比较。

先来比较

(yi)HashTable 和Dic

数据结构

Hashtable和Dictionary从数据结构上来说都属于Hashtable（哈希表），都是对关键字（键值）进行散列操作，将关键字散列到Hashtable的某一个槽位中去，不同的是处理碰撞的方法。散列函数有可能将不同的关键字散列到Hashtable中的同一个槽中去，这个时候我们称发生了碰撞，为了将数据插入进去，我们需要另外的方法来解决这个问题。

采用链表法的是Dic 而采用开放寻址法(open addressing)-中双重散列的方法的是 HashTable

至于这两种数据结构的使用方法请自行阅读算法导论或者参照网上博客

但从底层的数据结构可以发现

如果增删的动作很多的话推荐使用Dic 因为解决碰撞的方式是List.Add

如果改动的动作很少查询的动作很多的话则推荐使用HashTable 因为映射查找之后只需要跳跃查找到碰撞后移动数据即可，另外当增加数据太多时，开放寻址的扩容很耗费性能（请阅读<算法导论>）

Dic 和HashTable使用比较

1：单线程程序中推荐使用 Dictionary, 有泛型优势, 且读取速度较快, 容量利用更充分.
2：多线程程序中推荐使用 Hashtable, 默认的 Hashtable 允许单线程写入, 多线程读取, 对 Hashtable 进一步调用 Synchronized() 方法可以获得完全线程安全的类型. 而 Dictionary 非线程安全, 必须人为使用 lock 语句进行保护, 效率大减.
3：Dictionary 有按插入顺序排列数据的特性 (注: 但当调用 Remove() 删除过节点后顺序被打乱), 因此在需要体现顺序的情境中使用 Dictionary 能获得一定方便. //Dic遍历时会采用插入时的遍历，而hashTable 采用遍历时则是打乱的

Hashtable 类和 Dictionary<TKey, TValue> 泛型类实现 IDictionary 接口
Dictionary<TKey, TValue> 泛型类还实现 IDictionary<TKey, TValue>泛型接口。
因此，这些集合中的每个元素都是一个键/值对。

Dictionary<TKey, TValue> 类与 Hashtable 类的功能相同
对于值类型，特定类型（不包括 Object）的 Dictionary<TKey, TValue> 的性能优于 Hashtable，这是因为 Hashtable 的元素属于 Object 类型，所以在存储或检索值类型时通常发生装箱和取消装箱操作。

(er)Dic 和 List<T>

关于数据结构：

在前边的比较已经介绍了Dic 那么 List <T> 的数据结构是什么样子的：

List<T>是 ArrayList 的泛型等效类(继承了泛型接口)

堆中的样子是这样的

我们为了讨论遍历时Dictionary和List的效率，有个高人写了个代码，这是载图

很明显，LIST效率要好的多。

问题剖析

同样是集合，为什么性能会有这样的差距。我们要从存储结构和操作系统的原理谈起。

首先我们清楚List<T>是对数组做了一层包装，我们在数据结构上称之为线性表，而线性表的概念是，在内存中的连续区域，除了首节点和尾节点外，每个节点都有着其唯一的前驱结点和后续节点。我们在这里关注的是连续这个概念。

而HashTable或者Dictionary，他是根据Key而根据Hash算法分析产生的内存地址，因此在宏观上是不连续的，虽然微软对其算法也进行了很大的优化。

由于这样的不连续，在遍历时，Dictionary必然会产生大量的内存换页操作，而List只需要进行最少的内存换页即可，这就是List和Dictionary在遍历时效率差异的根本原因。

所以根据value 的查找 dic 的效率是高于 List 的但是遍历的话则Dic 要差点。这就好比你要摘抄书里边的所有文字是根据目录查一个找一篇文章快，还是直接从正文开始从头到尾快遍历快一样。单独的找某一篇知道题目(key)的文章当然是从目录快了

再谈Dictionary

也许很多人说，既然Dictionary如此强大，那么我们为什么不用Dictionary来代替一切集合呢？

在这里我们除了刚才的遍历问题，还要提到Dictionary的存储空间问题，在Dictionary中，除了要存储我们实际需要的Value外，还需要一个辅助变量Key，这就造成了内存空间的双重浪费。

而且在尾部插入时，List只需要在其原有的地址基础上向后延续存储即可，而Dictionary却需要经过复杂的Hash计算，这也是性能损耗的地方。

List<T>和 DataTable

DataTable，IList性能比较
1）二进制序列化的情况

从测试结果可以看出，IList<T>序列化的文件大小比DataTable小得多，这意味着在数据传输中带宽占用小很多，所以在设计Remoting接口时尽量使用IList<T>作返回值。

２）XML序列化的情况

从测试结果可以看出，IList<T>序列化后的文件比同样比DataTable小，但差距已经没有二进制序列化那么明显了。而且IList<T>的二进制序列化和XML序列化相差很大，所以remoteing中建议使用二进制序列化。

３）操作性比较

　　DataTable有支持数据的提交、回滚、查询等强大的方法，但访问单元格内容的时候不方便，还要类型转换。

　　IList<T>则访问项的属性比较方便，有属性自动提示，不用类型转换，有LINQ的协助也能实现强大的查询。

码农公寓

相关文章