HashSet源码

HashSet源码

add()方法第一次添加元素分析

package com.JiHe_.Set_;

import java.util.HashSet;

public class Demo {
    public static void main(String[] args) {

        HashSet<Object> hashSet = new HashSet<>();

        hashSet.add("java");
        hashSet.add("lyc");
        hashSet.add("java");
        System.out.println("hashSet"+hashSet);

        /*
        源码解读
        1.执行HashSet
        public HashSet() {
            map = new HashMap<>();
        }
        2.执行一个add方法
        public boolean add(E e) {//这里的e是字符串常量(java)
            return map.put(e, PRESENT)==null;   // static PRESENT = new Object();
            //若为true则添加成功
        }
        3.put方法,该方法会执行hash(key)方法
        public V put(K key, V value) {//key=“java”,value=PRESENT,无实际意义,起到占位的作用
            return putVal(hash(key), key, value, false, true);
        }
        4.hash(key)会得到key对应的hash值
        static final int hash(Object key) {
            int h;
            return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);//无符号右移16位,是降低hash冲突几率
        }
        5.执行putVal(hash(key),
        final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;//定义了辅助变量
        //这里的table,就是HashMap的一个数组,类型是Node[]数组
        //if语句表示,如果table为空,或者数组长度为0,就第一次扩容table的空间到16
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;//执行完本语句,table已获得16的大小
        //(1)根据传入key的hash值,去计算key应该存放在table标的哪个索引位置,
        //并把这个位置的对象赋给p
        //(2)继续判断p是否为空
            (2.1),如果p为空表示,还没有存放元素,就创建一个Node,key是真正存放的对象,value就是占位的PRESENT,hash的作用是用来判断下一个进来的值,如果下一个元素的
            hash值不相等,就会在该元素的后面添加。

        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);//直接放在该位置
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;//若下方返回不为null,则返回旧的值
            }
        }
        ++modCount;
        //判断大小是否已经超过12,
        if (++size > threshold)
            resize();//扩容
        afterNodeInsertion(evict);//这个方法是,留给HashMap子类来实现的,对HashMao自己来说,它就是个空方法
        return null;//返回空,代表成功
    }


         */
    }

}

当add方法继续添加元素时

package com.JiHe_.Set_;

import java.util.HashSet;

public class Demo03 {
    public static void main(String[] args) {

        HashSet<Object> hashSet = new HashSet<>();

        hashSet.add("java");
        hashSet.add("lyc");
        hashSet.add("java");
        System.out.println("hashSet"+hashSet);
        /*
        1.第二次添加时
        //此时hash经过运算=7,所以这个数据会放在7的位置
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        3.第三次添加时
        //此时hash还是等于3,而3的位置上已经有元素,不等于空,所以执行else内的语句
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
        //一个开发技巧提示:在需要局部变(辅助变量)时再创建,

            Node<K,V> e; K k;
            //如果当前索引位置对应的链表的第一个元素,和准备添加的key的hash值一样
            //并且满足下面两个条件之一:就不能加入
            //(1)准备加入的 key 和 p指向的Node结点的key是同一个对象
            //(2)p指向Node结点的key的equals( )方法和准备加入的key比较后相同
            //理解:第一种比较字符串。第二种比较对象
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
                //判断p是不是一颗红黑树,如果是:就调用putTreeVal方法进行添加
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
            //只有数组里的索引位置被占用了才开始比较,不然索引位置可以放的。
            //如果当前索引位置对应的链表的第一个元素
            //如果当前table对应的索引位置已经是一个链表了,就使用for循环依次和该链表中的所有元素一一比较后
            //都不相同说明添加的元素,没有重复,则添加到最后
            //如果有一个相同,则直接退出
                for (int binCount = 0; ; ++binCount) {//死循环
                    if ((e = p.next) == null) {
                    //比较的过程中没有相同元素,则把该元素,放在链表的末尾,然后break
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        //注意把元素添加到链表后,立即判断该链表是否已经有8个结点,如果是则,直接对当前链表进行树化(转成红黑树)
                        //但是在要进行树化时还要进行判断if (tab == null || (ntab.length)MIN_TREEIFY_CAPACITY)
                        //如果table数组不大于64,则进行扩容。
                            treeifyBin(tab, hash);
                        break;
                    }
                    //比较的过程中有相同元素,直接break
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
               //每比一次p指向一个新的结点,e又指向新的p的后一个结点,双指针法的精髓,妙蛙种子,进米奇妙妙屋,妙到家了
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        */
    }
}

equals方法

Object的equals()方法源码

  • Object的equals方法,此时两个引用类型进行比较:比较的默认为地址,或者对象
  • 也就是判断两个对象是否是同一个对象
public boolean equals(Object obj) {
    return (this == obj);
}

String的equals方法源码

  • 重写了Object中的eqyals()方法,方法功能为,一个字符一个字符的比较字符串的内容
public boolean equals(Object anObject) {
    if (this == anObject) {
        return true;
    }
    if (anObject instanceof String) {
        String anotherString = (String)anObject;
        int n = value.length;
        if (n == anotherString.value.length) {
            char v1[] = value;
            char v2[] = anotherString.value;
            int i = 0;
            while (n-- != 0) {
                if (v1[i] != v2[i])
                    return false;
                i++;
            }
            return true;
        }
    }
    return false;
}

HashSet的扩容机制

1.HashSet底层是HashMap,第一次添加时,table数组扩容到16,
临界值是(threshold)是16*加载因子(loadFactor)是0.75 =12,

2.如果table数组使用到了加载因子12,那么数组就会扩容到162=32,
新的临界值也就是32*0.75=24,以此类推,

3.可以通过一下小程序Debug,一步一步查看扩容的过程

package com.JiHe_.Set_;

import java.util.HashSet;

public class Demo04 {
    public static void main(String[] args) {
        /*
        1.HashSet底层是HashMap,第一次添加时,table数组扩容到16,
        临界值是(threshold)是16*加载因子(loadFactor)是0.75 =12,
        2.如果table数组使用到了加载因子12,那么数组就会扩容到16*2=32,
        新的临界值也就是32*0.75=24,以此类推,
        */

        HashSet hashSet = new HashSet();
        for (int i = 0; i <100 ; i++) {
            hashSet.add(i);//1,2,3,4,5.....100;
        }
    }
}

树化机制

  • 在java8中,如果有一条链表的元素个数到达(TREEIFY_THRESHOLD)默认是8,并且table的大小>=MIN_CAPACITY(默认为64)
  • 就会进行树化,(红黑树),若链表元素已经到达8,而table不足64,则进行扩容一次,链表添加一个元素,数组扩容一次,
  • 直到table大于等于64,进行树化
package com.JiHe_.Set_;

import java.util.HashSet;

public class Demo05 {

    public static void main(String[] args) {
        HashSet hashSet = new HashSet();
        for (int i = 1; i <=12 ; i++) {
            hashSet.add(new A1(i));
        }
        System.out.println("hashSet="+hashSet);


    }
}
class A1{
    private int n;
    public  A1(int n){
        this.n=n;
    }
    //重写HashCod,使所有的元素的hash值一样,这样就会使这些元素加入同一个链表中
    @Override
    public int hashCode() {
        return 100;
    }
}

HashSet源码

上一篇:集合(ArrayList|LinkedList|vector|stack|Queue|hashSet|TreeSet|HashMap|TreeMap)


下一篇:Set集合