早在Java 2中之前,Java就提供了特设类。比如:向量(Vector)、栈(Stack)、字典(Dictionary)、哈希表(Hashtable)这些类(数据结构)用来存储和操作对象组。虽然这些类都非常有用,但是它们缺少一个核心的,统一的主题。集合框架是为表示和操作集合而规定的一种统一的标准的体系结构。除了集合,该框架(framework)也定义了几个Map接口和类。Map里存储的是键/值对。尽管Map不是collections,但是它们完全整合在集合中。
所有的集合框架都包含如下内容:
- 接口:是代表集合的抽象数据类型。接口允许集合独立操纵其代表的细节。在面向对象的语言,接口通常形成一个层次。
- 实现(类):是集合接口的具体实现。从本质上讲,它们是可重复使用的数据结构。
- 算法:是实现集合接口的对象里的方法执行的一些有用的计算,例如:搜索和排序。这些算法被称为多态,那是因为相同的方法可以在相似的接口上有着不同的实现。
集合框架的类和接口均在java.util包中。
下图是简化的集合框架关系图:
集合接口
整个集合框架就围绕一组标准接口而设计。你可以直接使用这些接口的标准实现,诸如: LinkedList, HashSet, 和 TreeSet等,除此之外你也可以通过这些接口实现自己的集合。具体接口及其概述如下:
名称 | 概述 |
---|---|
Collection | Collection 是最基本的集合接口,一个 Collection 代表一组 Object,Java不提供直接继承自Collection的类,只提供继承于的子接口(如List和set)。 |
List | List接口是一个有序的Collection,使用此接口能够精确的控制每个元素插入的位置,能够通过索引(元素在List中位置,类似于数组的小标)来访问List中的元素,而且允许有相同的元素。 |
Set | Set 具有与 Collection 完全一样的接口,只是行为上不同,Set 不保存重复的元素。 |
SortedSet | 继承于Set保存有序的集合。 |
Map | 将唯一的键映射到值。 |
Map.Entry | 描述在一个Map中的一个元素(键/值对)。是一个Map的内部类。 |
SortedMap | 继承于Map,使Key保持在升序排列。 |
Enumeration | 这是一个传统的接口和定义的方法,通过它可以枚举(一次获得一个)对象集合中的元素。这个传统接口已被迭代器取代。 |
更多参见:在线文档-jdk-zh。
集合实现类
集合类型 | 描述 |
---|---|
ArrayList | 一种可以动态增长和缩减的索引序列 |
LinkedList | 一种可以在任何位置进行高效地插入和删除操作的有序序列 |
ArrayDeque | 一种用循环数组实现的双端队列 |
HashSet | 一种没有重复元素的无序集合 |
TreeSet | 一种有序集 |
EnumSet | 一种包含枚举类型值的集 |
LinkedHashSet | 一种可以记住元素插入次序的集 |
PriorityQueue | 一种允许高效删除最小元素的集合 |
HashMap | 一种储存键/值关联的数据结构 |
TreeMap | 一种键值有序排列的映射表 |
EnumMap | 一种键值属于枚举类型的映射表 |
WeakHashMap | 一种其值诶用武之地后可以被垃圾回收器回收的映射表 |
LinkedHashMap | 一种可以记住键/值项添加次序的映射表 |
IdentityHashMap | 一种用==,而不是用equals比较键值的映射表 |
另外还有一组名字以Abstract开头的类,例如,AbstractQueue,这些类是为类库实现者而设计的,用来实现自己的数据结构。
常用数据结构
向量(Vector)
Vector类实现了一个动态数组。和ArrayList和相似,但是Vector是同步访问的(同步操作会耗费大量时间,建议在不需要同步时使用ArrayList),而且Vector包含了许多传统的方法,这些方法不属于集合框架。Vector主要用在事先不知道数组的大小,或者只是需要一个可以改变大小的数组的情况。需要注意的是向量中的数据被转化为Object对象,取出元素使用时要强制转化为原来的类型。
Vector类支持4种构造方法:
Vector(); //默认大小为10 Vector(int size); //创建指定大小的向量 Vector(int size,int incr); //指定大小和增量,增量表示向量每次增加的元素数目 Vector(Collection c); //创建一个包含集合c元素的向量
常用方法:
| 方法 | 描述 |
|------|------|
| boolean add(E e) | 将指定元素添加到此向量的末尾。 |
| void add(int index, E element) | 在此向量的指定位置插入指定的元素。 |
| E remove(int index) |移除此向量中指定位置的元素。 |
| boolean remove(Object o) | 移除此向量中指定元素的第一个匹配项,不包含则元素保持不变。 |
| E set(int index, E element) | 用指定的元素替换此向量中指定位置处的元素。 |
| void setElementAt(E obj, int index) | 将此向量指定 index 处的组件设置为指定的对象。 |
| E get(int index) | 返回向量中指定位置的元素。 |
| int indexOf(Object o) | 返回此向量中第一次出现的指定元素的索引,不包含则返回 -1。 |
| boolean isEmpty() | 测试此向量是否不包含组件。 |
| void clear() | 从此向量中移除所有元素。 |
| int capacity() | 返回此向量的当前容量。 |
| boolean contains(Object o) | 如果此向量包含指定的元素,则返回 true。 |
| void setSize(int newSize) | 设置此向量的大小。 |
| void trimToSize() | 对此向量的容量进行微调,使其等于向量的当前大小。 |
>
>Vector还定义了很多其他方法,具体可以看:[Java Vector 类](http://www.runoob.com/java/java-vector-class.html)。
哈希表(Hashtable)
Hashtable(确实是小写的t)是原始的java.util的一部分, 是一个Dictionary具体的实现 。然而,Java 2 重构的Hashtable实现了Map接口,因此,Hashtable现在集成到了集合框架中。它和HashMap类很相似,但是它支持同步(同样建议不需要同步时使用HashMap)。像HashMap一样,Hashtable在哈希表中存储键/值对。当使用一个哈希表,要指定用作键的对象,以及要链接到该键的值。然后,该键经过哈希处理,所得到的散列码被用作存储在该表中值的索引。
Hashtable定义了四个构造方法:
Hashtable(); //默认的初始容量 (11) 和加载因子 (0.75) Hashtable(int initialCapacity); //指定初始容量和默认的加载因子 (0.75) Hashtable(int initialCapacity, float loadFactor); // Hashtable(Map m); //以M中元素为初始化元素,哈希表的容量为M的两倍。
如果散列表的装载因子是0.75,那么当散列表的容量被使用了75%时,就会自动将容量增加到原始容量的2倍。通常,默认加载因子(0.75)在时间和空间成本上寻求一种折中,装载因子过高虽然减少了空间开销,但同时也增加了查找某个条目的时间。
常用方法:
| 方法 | 描述 |
|-----|------|
| V put(K key, V value) | 将指定 key 映射到此哈希表中的指定 value。 |
| V remove(Object key) | 从哈希表中移除该键及其相应的值。|
| V get(Object key) | 返回指定键所映射到的值,不包含则返回 null。 |
| void clear() | 将此哈希表清空,使其不包含任何键。 |
| boolean containsValue(Object value) | 如果此 Hashtable 将一个或多个键映射到此值,则返回 true。 |
| boolean isEmpty() | 测试此哈希表是否没有键映射到值。 |
| int size() | 返回此哈希表中的键的数量。 |
| void rehash() | 增加此哈希表的容量并在内部对其进行重组,以便更有效地容纳和访问其元素。 |
>
>Hashtable中还定义了一些其他方法,具体可以看:[Java HashTable 接口](http://www.runoob.com/java/java-hashTable-class.html)。
栈(Stack)
栈是Vector的一个子类,它实现了一个标准的后进先出的栈。堆栈只定义了默认构造函数,用来创建一个空栈。 堆栈除了包括由Vector定义的所有方法,也定义了自己的一些方法,如下:
| 方法 | 描述 |
|------|------|
| boolean empty() | 测试堆栈是否为空。 |
| Object peek( ) | 查看堆栈顶部的对象,但不从堆栈中移除它。 |
| Object pop( ) | 移除堆栈顶部的对象,并作为此函数的值返回该对。 |
| Object push(Object element) | 把项压入堆栈顶部。 |
| int search(Object element) | 返回对象在堆栈中的位置,以 1 为基数。 |
>但是Deque **接口**及其实现提供了 LIFO 堆栈操作的更完整和更一致的 set,应该优先使用此 set,而非此类。
>
>注:Java 中 Queue 是接口, Deque 是其子接口,LinkedList 和 PriorityQueue 是其实现类,而 ArrayDeque 是 Deque 接口的实现类。具体方法可以查看:[JDK 1.6 在线中文手册](http://www.runoob.com/manual/jdk1.6/)。
链表(LinkedList)
LinkedList是一个双端链表,存放在结点中的数据都被看作是一个Object对象。由于任何类都是Object类的间接子类,因此,可以把任何一个对象作为链表结点中的数据。需要注意的是get()方法返回的类型是Object,要类型转换回原来的类型。
构造方法:LinkedList(); //构造一个空列表 LinkedList(Collection<? extends E> c); //包含指定 collection 中的元素
常用方法:
| 方法 | 描述 |
|------|-----|
| boolean add(E e) | 将指定元素添加到此列表的**结尾**。 |
| void add(int index, E element) | 在此列表中指定的位置插入指定的元素。 |
| E remove(int index) | 移除此列表中指定位置处的元素。 |
| E remove() | 获取并移除此列表的头(第一个元素)。 |
| boolean remove(Object o) | 移除首次出现的指定元素,不包含则不作更改。|
| E set(int index, E element) | 将此列表中指定位置的元素替换为指定的元素。 |
| E get(int index) | 返回此列表中指定位置处的元素。**效率低**,并非随机访问。 |
| int indexOf(Object o) | 返回此列表中首次出现的指定元素的索引,不存在则返回-1. |
| boolean contains(Object o) | 至少包含一个指定元素,则返回 true。 |
| int size() | 返回此列表的元素数。 |
| void clear() | 从此列表中移除所有元素。 |
| Object clone() | 返回此 LinkedList 的浅表副本。(这些元素本身没有复制。) |
| Object[] toArray() | 此方法返回一个新数组,调用者可以随意修改。 |
>LinkedList也实现了Deque接口,List接口和Queue接口,存在方法支持其用作堆栈、队列或双端队列,这里不做展开,具体方法可以查看:[JDK 1.6 在线中文手册](http://www.runoob.com/manual/jdk1.6/)。
参考资料
- 实验楼:JDK 核心 API
- Java核心技术 卷Ⅰ基础知识 原书第8版
- 菜鸟教程:Java 集合框架、Java 数据结构
- Java2实用教程 (第三版)_ 耿祥义,张跃平