Set是一个接口,它有两种实现分别是HashSet和TreeSet。 Set的特点是不保存重复的元素,它和数学概念上的集合相似,它支持交集、并集、差集操作。 本文将介绍HashSet和TreeSet使用的数据结构以及两种Set实现各自的应用场景,然后介绍交集、并集、差集的使用。
HashSet vs TreeSet
HashSet底层使用HashMap实现,使用了数组和散列算法实现,TreeSet使用TreeMap实现,使用了红黑树数据结构。关于HashMap和TreeMap实现原理可以翻阅前面的文章。HashSet的优点是查找速度快,缺点是不能顺序遍历Set中的元素,TreeSet的优点是可以顺序遍历Set中的元素,缺点是查找速度比HashSet稍慢,实际应用中优先使用HashSet,有排序需求时才考虑使用TreeSet。
交集
假设有集合A和集合B,所有既属于A又属于B的元素组成的集合,称为集合A于集合B的交集。Set中交集使用retainAll方法实现, 示例代码如下:
//交集示例代码
Set<String> set1 = new HashSet<String>();
set1.add("A");
set1.add("B");
set1.add("C");
set1.add("D");
Set<String> set2 = new HashSet<String>();
set2.add("C");
set2.add("D");
set2.add("E");
set2.add("F");
set1.retainAll(set2);
System.out.println(set1);
/*程序执行输出结果:
[C, D]
*/
并集
假设有集合A和集合B,把A和B中的所有元素合并在一起组成的集合,称为集合A和集合B的并集。Set中并集使用addAll方法实现,示例代码如下:
//并集操作示例代码
Set<String> set1 = new HashSet<String>();
set1.add("A");
set1.add("B");
set1.add("C");
set1.add("D");
Set<String> set2 = new HashSet<String>();
set2.add("E");
set2.add("F");
set2.add("G");
set2.add("H");
set1.addAll(set2);
System.out.println(set1);
/*程序执行输出结果:
[A, B, C, D, E, F, G, H]
*/
差集
假设有集合A和集合B,所有属于A且不属于B的元素组成的集合,称为集合A和集合B的差集。Set中 差集使用removeAll方法实现,示例代码如下:
//差集操作示例代码
Set<String> set1 = new HashSet<String>();
set1.add("A");
set1.add("B");
set1.add("C");
set1.add("D");
Set<String> set2 = new HashSet<String>();
set2.add("C");
set2.add("D");
set2.add("E");
set2.add("F");
set1.removeAll(set2);
System.out.println(set1);
/*程序执行输出结果:
[A, B]
*/
最后
交集、并集、差集使用的方法都来自Collection接口,那么实现了Collection的其它非Set容器是否也可以进行数学集合操作?严格意义上来说只有Map和Set可以用来实现数学集合操作,因为数学集合没有重复元素,Map和Set不能包含重复的键或元素,而数组、链表数据结构可以包含重复的元素,所以只能使用Map和Set来处理数学集合操作。Map是一个键值对集合,如果使用Map进行数学集合操作,那么我们往Map中添加元素时除了键以外还需要指定一个值。Set底层是对Map的封装,它隐藏了Map中键值对的值,我们只需关注键,所以实际应用中数学集合操作只用Set处理。