HashSet源码

2022-12-09 15:14:44

HashSet源码

add（）方法第一次添加元素分析

package com.JiHe_.Set_;

import java.util.HashSet;

public class Demo {
    public static void main(String[] args) {

        HashSet<Object> hashSet = new HashSet<>();

        hashSet.add("java");
        hashSet.add("lyc");
        hashSet.add("java");
        System.out.println("hashSet"+hashSet);

        /*
        源码解读
        1.执行HashSet
        public HashSet() {
            map = new HashMap<>();
        }
        2.执行一个add方法
        public boolean add(E e) {//这里的e是字符串常量（java）
            return map.put(e, PRESENT)==null;   // static PRESENT = new Object();
            //若为true则添加成功
        }
        3.put方法，该方法会执行hash(key)方法
        public V put(K key, V value) {//key=“java”,value=PRESENT，无实际意义，起到占位的作用
            return putVal(hash(key), key, value, false, true);
        }
        4.hash(key)会得到key对应的hash值
        static final int hash(Object key) {
            int h;
            return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);//无符号右移16位，是降低hash冲突几率
        }
        5.执行putVal(hash(key),
        final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;//定义了辅助变量
        //这里的table，就是HashMap的一个数组，类型是Node[]数组
        //if语句表示，如果table为空，或者数组长度为0，就第一次扩容table的空间到16
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;//执行完本语句，table已获得16的大小
        //（1）根据传入key的hash值，去计算key应该存放在table标的哪个索引位置，
        //并把这个位置的对象赋给p
        //（2）继续判断p是否为空
            （2.1），如果p为空表示，还没有存放元素，就创建一个Node，key是真正存放的对象，value就是占位的PRESENT，hash的作用是用来判断下一个进来的值，如果下一个元素的
            hash值不相等，就会在该元素的后面添加。

        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);//直接放在该位置
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;//若下方返回不为null，则返回旧的值
            }
        }
        ++modCount;
        //判断大小是否已经超过12，
        if (++size > threshold)
            resize();//扩容
        afterNodeInsertion(evict);//这个方法是，留给HashMap子类来实现的，对HashMao自己来说，它就是个空方法
        return null;//返回空，代表成功
    }


         */
    }

}

当add方法继续添加元素时

package com.JiHe_.Set_;

import java.util.HashSet;

public class Demo03 {
    public static void main(String[] args) {

        HashSet<Object> hashSet = new HashSet<>();

        hashSet.add("java");
        hashSet.add("lyc");
        hashSet.add("java");
        System.out.println("hashSet"+hashSet);
        /*
        1.第二次添加时
        //此时hash经过运算=7，所以这个数据会放在7的位置
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        3.第三次添加时
        //此时hash还是等于3，而3的位置上已经有元素，不等于空，所以执行else内的语句
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
        //一个开发技巧提示：在需要局部变（辅助变量）时再创建，

            Node<K,V> e; K k;
            //如果当前索引位置对应的链表的第一个元素，和准备添加的key的hash值一样
            //并且满足下面两个条件之一：就不能加入
            //（1）准备加入的 key 和 p指向的Node结点的key是同一个对象
            //（2）p指向Node结点的key的equals( )方法和准备加入的key比较后相同
            //理解：第一种比较字符串。第二种比较对象
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
                //判断p是不是一颗红黑树，如果是：就调用putTreeVal方法进行添加
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
            //只有数组里的索引位置被占用了才开始比较，不然索引位置可以放的。
            //如果当前索引位置对应的链表的第一个元素
            //如果当前table对应的索引位置已经是一个链表了，就使用for循环依次和该链表中的所有元素一一比较后
            //都不相同说明添加的元素，没有重复，则添加到最后
            //如果有一个相同，则直接退出
                for (int binCount = 0; ; ++binCount) {//死循环
                    if ((e = p.next) == null) {
                    //比较的过程中没有相同元素，则把该元素，放在链表的末尾，然后break
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        //注意把元素添加到链表后，立即判断该链表是否已经有8个结点，如果是则，直接对当前链表进行树化（转成红黑树）
                        //但是在要进行树化时还要进行判断if (tab == null || (ntab.length)MIN_TREEIFY_CAPACITY)
                        //如果table数组不大于64，则进行扩容。
                            treeifyBin(tab, hash);
                        break;
                    }
                    //比较的过程中有相同元素，直接break
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
               //每比一次p指向一个新的结点，e又指向新的p的后一个结点，双指针法的精髓，妙蛙种子，进米奇妙妙屋，妙到家了
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        */
    }
}

equals方法

Object的equals（）方法源码

Object的equals方法，此时两个引用类型进行比较：比较的默认为地址，或者对象
也就是判断两个对象是否是同一个对象

public boolean equals(Object obj) {
    return (this == obj);
}

String的equals方法源码

重写了Object中的eqyals（）方法，方法功能为，一个字符一个字符的比较字符串的内容

public boolean equals(Object anObject) {
    if (this == anObject) {
        return true;
    }
    if (anObject instanceof String) {
        String anotherString = (String)anObject;
        int n = value.length;
        if (n == anotherString.value.length) {
            char v1[] = value;
            char v2[] = anotherString.value;
            int i = 0;
            while (n-- != 0) {
                if (v1[i] != v2[i])
                    return false;
                i++;
            }
            return true;
        }
    }
    return false;
}

HashSet的扩容机制

1.HashSet底层是HashMap，第一次添加时，table数组扩容到16，
临界值是（threshold）是16*加载因子（loadFactor）是0.75 =12，

2.如果table数组使用到了加载因子12，那么数组就会扩容到162=32，
新的临界值也就是32*0.75=24，以此类推，

3.可以通过一下小程序Debug，一步一步查看扩容的过程

package com.JiHe_.Set_;

import java.util.HashSet;

public class Demo04 {
    public static void main(String[] args) {
        /*
        1.HashSet底层是HashMap，第一次添加时，table数组扩容到16，
        临界值是（threshold）是16*加载因子（loadFactor）是0.75 =12，
        2.如果table数组使用到了加载因子12，那么数组就会扩容到16*2=32，
        新的临界值也就是32*0.75=24，以此类推，
        */

        HashSet hashSet = new HashSet();
        for (int i = 0; i <100 ; i++) {
            hashSet.add(i);//1,2,3,4,5.....100；
        }
    }
}

树化机制

在java8中，如果有一条链表的元素个数到达(TREEIFY_THRESHOLD)默认是8，并且table的大小>=MIN_CAPACITY(默认为64)
就会进行树化，（红黑树），若链表元素已经到达8，而table不足64，则进行扩容一次，链表添加一个元素，数组扩容一次，
直到table大于等于64，进行树化

package com.JiHe_.Set_;

import java.util.HashSet;

public class Demo05 {

    public static void main(String[] args) {
        HashSet hashSet = new HashSet();
        for (int i = 1; i <=12 ; i++) {
            hashSet.add(new A1(i));
        }
        System.out.println("hashSet="+hashSet);


    }
}
class A1{
    private int n;
    public  A1(int n){
        this.n=n;
    }
    //重写HashCod，使所有的元素的hash值一样，这样就会使这些元素加入同一个链表中
    @Override
    public int hashCode() {
        return 100;
    }
}

码农公寓

HashSet源码

add（）方法第一次添加元素分析

当add方法继续添加元素时

equals方法

Object的equals（）方法源码

String的equals方法源码

HashSet的扩容机制

树化机制

相关文章