java数据结构之HashSet和TreeSet以及LinkedHashSet

一、HashSet源码注释

public class HashSet<E>
extends AbstractSet<E>
implements Set<E>, Cloneable, java.io.Serializable
{
static final long serialVersionUID = -5024744406713321676L; //HashSet底层是HashMap
private transient HashMap<E,Object> map; // 用来在HashMap中所有的key对应的value值指向这个对象
private static final Object PRESENT = new Object(); /**
* 创建空的HashSet,实际上是创建了一个默认实现的HashMap
*/
public HashSet() {
map = new HashMap<>();
} /**
* 利用集合创建HashSet
*/
public HashSet(Collection<? extends E> c) {
map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
addAll(c);
} /**
* 手动指定容量和加载因子创建HashSet
*/
public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<>(initialCapacity, loadFactor);
} /**
* 创建指定容量的HashSet
*/
public HashSet(int initialCapacity) {
map = new HashMap<>(initialCapacity);
} /**
* 底层是LinkedHashSet
*/
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<>(initialCapacity, loadFactor);
} /**
* 获取迭代器
*/
public Iterator<E> iterator() {
return map.keySet().iterator();
} /**
* 获取元素数量
*/
public int size() {
return map.size();
} /**
* 判断是否为空
*/
public boolean isEmpty() {
return map.isEmpty();
} /**
* 判断HashSet是否存在该 对象
*/
public boolean contains(Object o) {
return map.containsKey(o);
} /**
* 新增一个元素,这个元素在HashMap中作为Key,而value则是一个公共的Object
*/
public boolean add(E e) {
return map.put(e, PRESENT)==null;
} /**
* 删除一个元素
*/
public boolean remove(Object o) {
return map.remove(o)==PRESENT;
} /**
* 清空整个集合
*/
public void clear() {
map.clear();
} /**
* 浅克隆
*/
@SuppressWarnings("unchecked")
public Object clone() {
try {
HashSet<E> newSet = (HashSet<E>) super.clone();
newSet.map = (HashMap<E, Object>) map.clone();
return newSet;
} catch (CloneNotSupportedException e) {
throw new InternalError(e);
}
} /**
* 将HashSet写入流中
*/
private void writeObject(java.io.ObjectOutputStream s)
throws java.io.IOException {
// Write out any hidden serialization magic
s.defaultWriteObject(); // Write out HashMap capacity and load factor
s.writeInt(map.capacity());
s.writeFloat(map.loadFactor()); // Write out size
s.writeInt(map.size()); // Write out all elements in the proper order.
for (E e : map.keySet())
s.writeObject(e);
} /**
* 从流中读取HashSet的元素
*/
private void readObject(java.io.ObjectInputStream s)
throws java.io.IOException, ClassNotFoundException {
// Read in any hidden serialization magic
s.defaultReadObject(); // Read capacity and verify non-negative.
int capacity = s.readInt();
if (capacity < 0) {
throw new InvalidObjectException("Illegal capacity: " +
capacity);
} // Read load factor and verify positive and non NaN.
float loadFactor = s.readFloat();
if (loadFactor <= 0 || Float.isNaN(loadFactor)) {
throw new InvalidObjectException("Illegal load factor: " +
loadFactor);
} // Read size and verify non-negative.
int size = s.readInt();
if (size < 0) {
throw new InvalidObjectException("Illegal size: " +
size);
} // Set the capacity according to the size and load factor ensuring that
// the HashMap is at least 25% full but clamping to maximum capacity.
capacity = (int) Math.min(size * Math.min(1 / loadFactor, 4.0f),
HashMap.MAXIMUM_CAPACITY); // Create backing HashMap
map = (((HashSet<?>)this) instanceof LinkedHashSet ?
new LinkedHashMap<E,Object>(capacity, loadFactor) :
new HashMap<E,Object>(capacity, loadFactor)); // Read in all elements in the proper order.
for (int i=0; i<size; i++) {
@SuppressWarnings("unchecked")
E e = (E) s.readObject();
map.put(e, PRESENT);
}
} /**
* 分割迭代器
*/
public Spliterator<E> spliterator() {
return new HashMap.KeySpliterator<E,Object>(map, 0, -1, 0, 0);
}
}

二、HashSet源码分析

  1、通过代码可以看到其底层是一个HashMap,存入HashSet中的对象都会作为HashMap中的key来保存起来,所有的key都对应着同一个value。

  private static final Object PRESENT = new Object();

  2、由于所有的元素都是作为key来保存起来的所以当两个元素一样的时候是不会保存第二个的,这样就很好的解决了元素重复的问题,所以HashSet中的 元素是不重复的。

三、TreeSet源码

  

public class TreeSet<E> extends AbstractSet<E>
implements NavigableSet<E>, Cloneable, java.io.Serializable
{ private transient NavigableMap<E,Object> m; private static final Object PRESENT = new Object(); /**
* Constructs a set backed by the specified navigable map.
*/
TreeSet(NavigableMap<E,Object> m) {
this.m = m;
} public TreeSet() {
this(new TreeMap<E,Object>());
} /**
* 传入比较器
*/
public TreeSet(Comparator<? super E> comparator) {
this(new TreeMap<>(comparator));
} /**
* 通过集合创建TreeSet,按照元素的自然排序
*/
public TreeSet(Collection<? extends E> c) {
this();
addAll(c);
} /**
* 通过SortedSet的实现类来创建TreeSet,指定比较器为SortedSet实现类的比较器
*/
public TreeSet(SortedSet<E> s) {
this(s.comparator());
addAll(s);
} /**
* 返回迭代器
*/
public Iterator<E> iterator() {
return m.navigableKeySet().iterator();
} /**
* 返回逆序迭代器
*/
public Iterator<E> descendingIterator() {
return m.descendingKeySet().iterator();
} /**
* 逆序视图
*/
public NavigableSet<E> descendingSet() {
return new TreeSet<>(m.descendingMap());
} /**
* 元素个数
*/
public int size() {
return m.size();
} /**
* 集合是否为空
*/
public boolean isEmpty() {
return m.isEmpty();
} /**
* TreeSet是否包含元素o
*/
public boolean contains(Object o) {
return m.containsKey(o);
} /**
* 添加元素
*/
public boolean add(E e) {
return m.put(e, PRESENT)==null;
} /**
* 删除元素
*/
public boolean remove(Object o) {
return m.remove(o)==PRESENT;
} /**
* 清空集合
*/
public void clear() {
m.clear();
} /**
* 批量添加元素
*/
public boolean addAll(Collection<? extends E> c) {
// Use linear-time version if applicable
if (m.size()==0 && c.size() > 0 &&
c instanceof SortedSet &&
m instanceof TreeMap) {
SortedSet<? extends E> set = (SortedSet<? extends E>) c;
TreeMap<E,Object> map = (TreeMap<E, Object>) m;
Comparator<?> cc = set.comparator();
Comparator<? super E> mc = map.comparator();
if (cc==mc || (cc != null && cc.equals(mc))) {
map.addAllForTreeSet(set, PRESENT);
return true;
}
}
return super.addAll(c);
} /**
* 返回视图
*/
public NavigableSet<E> subSet(E fromElement, boolean fromInclusive,
E toElement, boolean toInclusive) {
return new TreeSet<>(m.subMap(fromElement, fromInclusive,
toElement, toInclusive));
} /**
* 返回小于toElement的元素视图,inclusive为true可以等于toElement
*/
public NavigableSet<E> headSet(E toElement, boolean inclusive) {
return new TreeSet<>(m.headMap(toElement, inclusive));
} /**
* 返回大于fromElement的元素视图,inclusive为true可以等于fromElement
*/
public NavigableSet<E> tailSet(E fromElement, boolean inclusive) {
return new TreeSet<>(m.tailMap(fromElement, inclusive));
} /**
* 返回fromElement,toElement中间的 视图
*/
public SortedSet<E> subSet(E fromElement, E toElement) {
return subSet(fromElement, true, toElement, false);
} /**
* 返回小于toElement的视图
*/
public SortedSet<E> headSet(E toElement) {
return headSet(toElement, false);
} /**
* 返回大于fromElement的元素视图
*/
public SortedSet<E> tailSet(E fromElement) {
return tailSet(fromElement, true);
}
//获取比较器
public Comparator<? super E> comparator() {
return m.comparator();
}
//返回第一个元素
public E first() {
return m.firstKey();
}
//返回最后一个元素
public E last() {
return m.lastKey();
} // NavigableSet API methods /**
* 返回小于e的最大的元素,没有就返回null
*/
public E lower(E e) {
return m.lowerKey(e);
} /**
* 返回小于或等于e的最大元素,没有返回null
*/
public E floor(E e) {
return m.floorKey(e);
} /**
* 返回大于等于e的最小元素
*/
public E ceiling(E e) {
return m.ceilingKey(e);
} /**
* 返回大于e的最小元素
*/
public E higher(E e) {
return m.higherKey(e);
} /**
* 返回并删除第一个元素
*/
public E pollFirst() {
Map.Entry<E,?> e = m.pollFirstEntry();
return (e == null) ? null : e.getKey();
} /**
* 返回并删除最后一个元素
*/
public E pollLast() {
Map.Entry<E,?> e = m.pollLastEntry();
return (e == null) ? null : e.getKey();
} private static final long serialVersionUID = -2479143000061671589L;
}

四、TreeSet源码分析

  1、TreeSet底层是基于TreeMap的,将加入的元素作为TreeMap的key,使用一个常量类来作为公共的value。

  2、既然是基于TreeMap,说明也是可以自定义构造器或者利用元素的自然排序。说明这个Set的有序的,且元素不会重复。

五、TreeSet和HashSet的区别

  1、TreeSet和HashSet都不能存储重复元素,集合里面的元素都是唯一的。

  2、HashSet是通过元素的Hash值来确定位置,且是无序的。TreeSet中的元素是有序的,通过比较器或者自然排序来对元素进行排序。

  3、HashSet中可以存储null,TreeSet中默认不可以存储null,但是可以通过自己定义比较器来实现null的存储。

  

六、LinkedHashSet和HashSet的区别与联系

   1、通过下面的代码可以看出LinkedHashSet是HashSet的子类,其底层是通过LinkedHashMap来实现数据的存储和排序的 。

public class LinkedHashSet<E>
extends HashSet<E>
implements Set<E>, Cloneable, java.io.Serializable { private static final long serialVersionUID = -2851667679971038690L; //调用父类的构造函数,通过HashSet的构造函数可知,LinkedHashSet底层是通过LinkedHashMap来实现的
public LinkedHashSet(int initialCapacity, float loadFactor) {
super(initialCapacity, loadFactor, true);
} public LinkedHashSet(int initialCapacity) {
super(initialCapacity, .75f, true);
} public LinkedHashSet() {
super(16, .75f, true);
} public LinkedHashSet(Collection<? extends E> c) {
super(Math.max(2*c.size(), 11), .75f, true);
addAll(c);
} @Override
public Spliterator<E> spliterator() {
return Spliterators.spliterator(this, Spliterator.DISTINCT | Spliterator.ORDERED);
}
}
上一篇:Python - 列表与字符串的互相转换


下一篇:《数据结构与算法分析:C语言描述》读书笔记