https://blog.csdn.net/qq_45574180/article/details/112107537
引言
在上篇文章中Java 集合框架(3)---- Map 相关类解析,我们将剩下的常见的
Map
接口下的相关具体类做了一个解析,还有一些相关的类将会在下一篇文章中做一个总结,这篇我们来看看Set
接口的相关类。
导航
老规矩,还是继续看一下 Set
接口下继承关系图:
和 List
、Map
接口很类似:Set
接口提供了两个子类和接口 AbstractSet
类和 SortedSet
接口,类比之前介绍 Map
接口下的 AbstractMap
类和 SortedMap
接口,我们就可以知道:AbstractSet类最大化的实现了 Set 接口中的一些抽象方法,使得其子类可以以最小的代价来实现一个 Set 具体类。
而 SortedSet
则是提供了一个将元素按照某种规则排序的一种约定
。在 SortedSet
中提供了一个方法:
/**
* Returns the comparator used to order the elements in this set,
* or <tt>null</tt> if this set uses the {@linkplain Comparable
* natural ordering} of its elements.
*
* @return the comparator used to order the elements in this set,
* or <tt>null</tt> if this set uses the natural ordering
* of its elements
*/
Comparator<? super E> comparator();
很明显这是一个用于得到元素之间的比较器
(Comparator)
对象的一个方法,我们来看看其返回的Comparator
接口:
public interface Comparator<T> {
// ...
/**
* 用于比较两个元素大小的方法,如果返回正数,证明 o1 > o2,如果返回负数,
* 则 o1 < o2,如果返回 0,证明 o1 == o2
*/
int compare(T o1, T o2);
// ...
}
这个接口关键的方法就是
compare
方法,其实在TreeMap
中也用到了,因为TreeMap 会将键值对元素按键的顺序排序
,那么具体的排序规则就看你如何重写这个方法了。
下面来看一下 Set
接口下一些具体的类:
HashSet
这个类用来尽量保证以 O(1)
的时间复杂度来添加/判断元素存在/移除元素
等。在之前我们已经知道了 HashMap
的原理,而记得在第一篇介绍 Map
的文章中Java 集合框架(3)---- Map 相关类解析就已经说过为什么先介绍 Map
再介绍Set
,我们直接来看看 HashSet
的源码吧,看完之后可能你就会觉得确实是这样的:
public class HashSet<E>
extends AbstractSet<E>
implements Set<E>, Cloneable, java.io.Serializable
{
private transient HashMap<E,Object> map;
// Dummy value to associate with an Object in the backing Map
private static final Object PRESENT = new Object();
public HashSet() {
map = new HashMap<>();
}
public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<>(initialCapacity, loadFactor);
}
public HashSet(int initialCapacity) {
map = new HashMap<>(initialCapacity);
}
// !!! 注意这个方法,是个彩蛋
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<>(initialCapacity, loadFactor);
}
/**
* 返回当前集合迭代器(Iterator)对象,用于遍历集合中的元素
*/
public Iterator<E> iterator() {
return map.keySet().iterator();
}
/**
* 返回当前集合中元素的个数
*/
public int size() {
return map.size();
}
/**
* 判断当前集合是否为空集合
*/
public boolean isEmpty() {
return map.isEmpty();
}
/**
* 判断对象 o 是否存在当前集合中(通过 equals 方法判断等价)
*/
public boolean contains(Object o) {
return map.containsKey(o);
}
/**
* 向当前集合元素中添加一个元素 e
*/
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
/**
* 移除参数所代表的元素(通过 equals 方法比较等价),移除成功返回 true,否则返回 false
*/
public boolean remove(Object o) {
return map.remove(o)==PRESENT;
}
/**
* 清除当前 Set 集合中所有的元素
*/
public void clear() {
map.clear();
}
// ...
大部分的常用方法就是这些(
添加元素
、移除元素
、遍历…
),我们可以看到,所有对元素的相关操作都交给了其内部的一个 HashMap
对象处理,而添加进HashSet
中的元素其实都是作为“键”
储存在了这个HashMap
对象中,那么其对应的值
呢?当然是那个Object 类型的 PRESENT
对象啦。同时在返回遍历元素的迭代器
的时候,也是返回了HashMap
对象中对应的keySet 的迭代器
。这么一来,你只要知道了HashMap
的运行机制,HashSet
对你来说就没有任何问题了。关于HashMap
的运行机制,可以参考之前的文章:Java 集合框架(3)---- Map 相关类解析。
TreeSet
这个类可以使得添加进入Set
集合中的元素按照某种规则来排序
,但是其并不是直接实现 SortedSet
接口,而是实现了 SortedSet
的一个子接口NavigableSet
,其实 TreeMap
本身也没有直接实现 SortedMap
接口,而是实现了其的一个子接口 NavigableMap
。而和 HashSet
类似,其内部也是借助了一个 TreeMap
类型的对象来实现相关的操作。关于TreeMap
可以参考:Java 集合框架(3)---- Map 相关类解析。
一、TreeMap 和 TreeSet 在排序时如何比较元素?Collections 工具类中的 sort()方法如何比较元素?
TreeSet
要求存放的对象所属的类必须实现Comparable
接口,该接口提供了比较元素的compareTo()
方法,当插入元素时会调该方法比较元素的大小
。TreeMap
要求存放的键值对映射的键
必须实现 Comparable
接口从而根据键对元素进行排序
。
Collections
工具类的 sort
方法有两种重载的形式:
- 第一种要求传入的待排序容器中存放的对象比较
实现 Comparable 接口
以实现元素的比较。 - 第二种不强制性的要求容器中的元素必须可比较,但是要求传入第二个参数,参数是
Comparator
接口的子类型(需要重写 compare 方法实现元素的比较
),相当于一个临时定义的排序规则
,其实就是通过接口注入比较元素大小的算法,也是对回调模式的应用
(Java 中对函数式编程
的支持)。
NavigableSet
先来看看 NavigableSet
的源码:
public interface NavigableSet<E> extends SortedSet<E> {
// 返回当前集合中小于 e 的最大的元素
E lower(E e);
// 返回当前集合中不大于 e 的最大的元素
E floor(E e);
// 返回当前集合中不小于 e 的最小的元素
E ceiling(E e);
// 返回当前集合中大于 e 的最小的元素
E higher(E e);
// 返回并移除当前集合中的第一个(最小的)元素
E pollFirst();
// 返回并移除当前集合中的最后一个(最大的)元素
E pollLast();
// 按元素升序顺序返回遍历元素的迭代器
Iterator<E> iterator();
// 按元素降序顺序返回遍历另一个包含元素的集合
NavigableSet<E> descendingSet();
// 按元素降序顺序返回遍历元素的迭代器,和上面的 iterator 方法相反
Iterator<E> descendingIterator();
// 返回一个子集合,大于 fromElement 并小于 toElement,
// 是否包含 fromElement 和 toElement 取决于 fromInclusive 和 toInclusive 参数是否为 true
NavigableSet<E> subSet(E fromElement, boolean fromInclusive,
E toElement, boolean toInclusive);
// ...
}
可以看到
NavigableSet
接口声明了一些返回集合
中一些特定元素/子集合
的方法,下面来看看TreeSet
的源码:
public class TreeSet<E> extends AbstractSet<E>
implements NavigableSet<E>, Cloneable, java.io.Serializable
{
/**
* The backing map. 用到的 TreeMap 对象
*/
private transient NavigableMap<E,Object> m;
// Dummy value to associate with an Object in the backing Map
// 固定的值对象
private static final Object PRESENT = new Object();
TreeSet(NavigableMap<E,Object> m) {
this.m = m;
}
public TreeSet() {
this(new TreeMap<E,Object>());
}
/**
* 构造方法,传入用于比较元素大小的 Comparator 类型的比较器。
* 如果元素类型实现了 Comparable 接口,那么不传这个参数也是可以的,
* TreeMap 会使用元素实现的 Comparable 接口中的 compareTo 来比较两个元素的大小
*/
public TreeSet(Comparator<? super E> comparator) {
this(new TreeMap<>(comparator));
}
public TreeSet(SortedSet<E> s) {
this(s.comparator());
addAll(s);
}
/**
* 返回升序(相对 Comparator 的 compare 方法而言)遍历元素的迭代器
*/
public Iterator<E> iterator() {
return m.navigableKeySet().iterator();
}
/**
* 返回逆序遍历元素的迭代器,和上一个方法相反
*/
public Iterator<E> descendingIterator() {
return m.descendingKeySet().iterator();
}
public int size() {
return m.size();
}
public boolean isEmpty() {
return m.isEmpty();
}
public boolean contains(Object o) {
return m.containsKey(o);
}
public boolean add(E e) {
return m.put(e, PRESENT)==null;
}
public boolean remove(Object o) {
return m.remove(o)==PRESENT;
}
public void clear() {
m.clear();
}
// ...
public E first() {
return m.firstKey();
}
public E last() {
return m.lastKey();
}
public E lower(E e) {
return m.lowerKey(e);
}
public E floor(E e) {
return m.floorKey(e);
}
// ...
}
同样的,也是内部借助了一个
TreeMap
对象来实现的相关方法。所以只要你理解TreeMap
的运行原理,那么TreeSet
对你来说也没有任何问题。
下面来看一下最后一个 Set
的具体类:LinkedHashSet
:
LinkedHashSet
就像 HashMap
和 LinkedHashMap
的关系一样,LinkedHashSet 是继承了 HashSet
的,这个类的作用时保证遍历元素得到的元素序列的顺序和插入元素的先后顺序一样
。而其中没有重写任何操作元素的方法,我们来看看:
public class LinkedHashSet<E>
extends HashSet<E>
implements Set<E>, Cloneable, java.io.Serializable {
public LinkedHashSet(int initialCapacity, float loadFactor) {
super(initialCapacity, loadFactor, true);
}
public LinkedHashSet(int initialCapacity) {
super(initialCapacity, .75f, true);
}
public LinkedHashSet() {
super(16, .75f, true);
}
public LinkedHashSet(Collection<? extends E> c) {
super(Math.max(2*c.size(), 11), .75f, true);
addAll(c);
}
// ...
}
第一眼看到这个类,我也有点吃惊: what!!?
就提供了构造方法?没有重写任何一个操作元素的方法?那怎么来维持元素的相对顺序?
(疑问三连)。但是我们注意到提供的三个构造方法都是调用了父类中具有 3 个参数的构造方法
,那么我们赶紧去其父类(HashSet)
中看看这个构造方法
:
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<>(initialCapacity, loadFactor);
}
看到这里我终于松了口气,这里的构造方法创建的是
LinkedHashMap
对象,我们通过前面的篇幅已经知道LinkedHashMap
是可以保证元素的遍历顺序是和元素插入顺序一样
的,因为它就是做这个工作的。关于其运行元素可以参考 Java 集合框架(3)---- Map 相关类解析 。我们继续,既然这里创建的是LinkedHashMap
对象,而同时HashSet 所有操作元素的相关方法都交给了对应的 map 来做
,那么在这里我们调用LinkedHashSet 中的一些操作元素的方法其实都是调用的 LinkedHashMap 中的相关方法,那么自然可以保证元素的遍历顺序和插入顺序一致。
好了,对 Set
接口的接口就到这里了,因为这里用到的都是 Map
接口下的相关具体类,所以篇幅并不是很长,关键还是对相关 Map
接口下的相关具体类的理解,请参考Java 集合框架(3)---- Map 相关类解析
总结
一、说一下 HashSet 的实现原理?
HashSet
是基于 HashMap
实现的,HashSet的值存放于HashMap的key
上,HashMap的value统一为PRESENT
,因此 HashSet
的实现比较简单,相关 HashSet
的操作,基本上都是直接调用底层 HashMap 的相关方法来完成
,HashSet 不允许重复的值
。
二、HashSet如何检查重复?HashSet是如何保证数据不可重复的?
向HashSet 中add ()
元素时,判断元素是否存在
的依据,不仅要比较hash值
,同时还要结合equles
方法比较。HashSet 中的add ()方法会使用HashMap 的put()方法。
HashMap 的 key 是唯一
的,由源码可以看出 HashSet 添加进去的值就是作为HashMap 的key
,并且在HashMap中如果K/V相同
时,会用新的V覆盖掉旧的V
,然后返回旧的V
。所以不会重复( HashMap 比较key是否相等
是先比较hashcode
再比较equals
)。
三、hashCode()与equals()的相关规定:
- 如果两个对象相等,则hashcode一定也是相同的。
- 两个对象相等,则两个equals方法返回true。
- 两个对象有相同的hashcode值,它们也不一定是相等的。
- 综上,equals方法被覆盖过,则hashCode方法也必须被覆盖
- hashCode()的默认行为是对堆上的对象产生独特值。如果没有重写hashCode(),则该class的两个对象无论如何都不会相等(即使这两个对象指向相同的数据)。
==与equals的区别:
- ==是判断两个变量或实例是不是指向同一个内存空间 equals是判断两个变量或实例所指向的内存空间的值是不是相同。
- ==是指对内存地址进行比较 equals()是对字符串的内容进行比较。
- ==指引用是否相同 equals()指的是值是否相同。
四、HashSet与HashMap的区别:
HashMap | HashSet |
---|---|
实现了Map接口 | 实现Set接口 |
存储键值对 | 仅存储对象 |
调用put()向map中添加元素 | 调用add()方法向Set中添加元素 |
HashMap使用键(Key)计算Hashcode | HashSet使用成员对象来计算hashcode值,对于两个对象来说hashcode可能相同,所以equals()方法用来判断对象的相等性,如果两个对象不同的话,那么返回false |
HashMap相对于HashSet较快,因为它是使用唯一的键获取对象 | HashSet较HashMap来说比较慢 |
五、List 和 Set 的区别:
List
, Set
都是继承自Collection
接口:
- List 特点:一个
有序
(元素存入集合的顺序和取出的顺序一致)容器,元素可以重复
,可以插入多个null元素
,元素都有索引
。常用的实现类有ArrayList
、LinkedList
和Vector
。 - Set 特点:一个
无序
(存入和取出顺序有可能不一致)容器,不可以存储重复元素
,只允许存入一个null元素
,必须保证元素唯一性
。Set
接口常用实现类是HashSet
、LinkedHashSet
以及TreeSet
。 - 另外
List 支持for循环
,也就是通过下标来遍历
,也可以用迭代器
,但是set只能用迭代
,因为他无序
,无法用下标来取得想要的值。
Set和List对比:
- Set:
检索元素效率低下
,删除和插入效率高
,插入和删除不会引起元素位置改变
。 - List:和
数组类似
,List可以动态增长
,查找元素效率高
,插入删除元素效率低
,因为会引起其他元素位置改变。