1. Set接口介绍及常用方法
1.1 无序无索引
虽然无序,但取出的顺序是固定的
1.2 不允许重复元素,最多包含一个null
1.3 Set接口也是Collection的子接口,常用方法和Collection一样
1.4 Set接口的遍历方式:
Iterator
增强for
不能用索引方式(即普通for循环)
HashSet set = new HashSet();
set.add("john");
set.add("lucy");
set.add("jack");
set.add(null);
System.out.println("set=" + set);
Iterator it = set.iterator();
System.out.println("--------in iterator---------");
while(it.hasNext()) {
System.out.println(it.next());
}
System.out.println("---------in for---------");
for(Object o: set) {
System.out.println(o);
}
2. HashSet
2.1 HashSet特点
2.1.1实现了Set接口
2.1.2hashSet实际上是HashMap
HashMap底层是数组+链表+红黑树
2.1.3 可以存放null,但最多只能有一个
2.1.4 HashSet不保证元素是有序的,取决于hash后,再确定索引的结果
2.1.5 不能有重复元素
3.HashSet
3.1 HashSet底层是HashMap
3.2 添加一个元素时,会先得到Hash值,通过算法转成索引值
3.3 找到存储数据表table,看这个索引位置是否已经有元素
3.4 如果没有,直接加入
3.5 如果有,调用equals比较,如果相同就放弃添加,如果不相同,则添加到最后
3.6 Java8中,如果一条链表的元素个数达到TREEIFY_THRESHOLD(默认是8),并且(需要同时
满足)table的大小大于等于MIN_TREEIFY_CAPACITY(默认64),就会红黑树化
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
//table就是HashMap的一个数组,类型是Node[]
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
//if语句表示如果当前table是null,或者大小=0,就第一次扩容,到16个空间
//(1)根据key,得到hash去计算key应该存放的索引位置
//并把这个位置的对象,赋给p
//(2)判断p是否为空
//(2.1)如果p=null,创建节点(key = "java", value = PRESENT)
//并放在该位置
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
//如果当前索引位置对应链表的第一个元素和准备添加的key的哈希值一样
//并且满足下列条件之一:
//(1)准备加入的key和p指向的Node节点的key是同一个对象
//(2)或者不是一个对象但是值相同,比如同一个类的两个实例
//就不能加入
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//判断p是否是一颗红黑树
//如果是红黑树,调用putTreeVal(涉及红黑树内容多)
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {//链表,循环比较
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
//无相同元素,添加在最后面
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
//如果达到第八个节点,则红黑树化,
//红黑树化时还会进行判断是否满足树化条件
// if (tab == null || (n = tab.length) <
// MIN_TREEIFY_CAPACITY(64))
// resize();
//如果上面条件成立,则先扩容,只有上面条件不成立才红黑树化
treeifyBin(tab, hash);
break;
}
//有相同元素
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;//指针后移
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
4. afterNodeInsertion(evict);
//此方法为HastMap留给子类的方法,在HashMap中为空方法,可理解为C++里的抽象函数
5. HashSet扩容和转成红黑树机制
5.1 HashSet第一次添加时,table数组扩容到16,临界值(threshold)是16 * 加载因子(DEFAULT_LOAD_FACTOR=0.75),如果table数组已用容量到了临界值12,就会扩容到16 * 2 = 32,新的临界值是32 * 0.75 = 24,以此类推。
5.2
Java8中,如果一条链表的元素个数达到TREEIFY_THRESHOLD(默认是8),并且(需要同时
满足)table的大小大于等于MIN_TREEIFY_CAPACITY(默认64),就会红黑树化。
如果只是一条链表的元素个数达到TREEIFY_THRESHOLD(默认是8),则会table扩容,直到table扩容至64,单条链表才会树化。
public class HashSet_p {
public static void main(String[] args) {
HashSet hashSet = new HashSet();
for (int i = 1; i <= 12; i++) {
hashSet.add(new A(i));
}
//在i=9时table会从16扩容到32,单条链表不会树化
//在i=10时table会从32扩容到64,单条链表不会树化
//在i=11时,满足树化条件,单条链表树化
System.out.println("hashset=" + hashSet);
}
}
class A {
private int n;
public A(int n) {
this.n = n;
}
//重写hashCode,使此类的实例化对象的hashCode都相等,都为100
@Override
public int hashCode() {
return 100;
}
}
5.3 putVal中
每增加一个节点(不必在一条单链上),size都会自增1,当满足条件时,table就会扩容。
6.练习:将多个对象存入HashSet中,如果两个对象的某几个指定属性相同则认为这两个对象相同,在存入前者的前提下后者应无法存入。
trick:在类定义中重写equals()方法
class Employee{
private String name;
private int age;
Employee(String name, int age){
this.name = name;
this.age = age;
}
@Override
public boolean equals(Object o) {
if (this == o) return true;
//是同一个对象
if (o == null || getClass() != o.getClass()) return false;
//比较对象为空或者不是一个类的实例
Employee employee = (Employee) o;
return age == employee.age &&
Objects.equals(name, employee.name);
}
}
h + Enter //重写equalsI() 和 hashCode()