Java中的hashCode() 和 equals()的若干问题解答

2023-03-16 07:16:47

一、hashCode()的作用

哈希表这个数据结构想必大多数人都不陌生，而且在很多地方都会利用到hash表来提高查找效率。在Java的Object类中有一个方法:

public native int hashCode();

根据这个方法的声明可知，该方法返回一个int类型的数值，并且是本地方法，因此在Object类中并没有给出具体的实现。为何Object类需要这样一个方法？它有什么作用呢？

不妨举个例子：

假设内存中有0 1 2 3 4 5 6 7 8这8个位置，如果我有个字段叫做ID，那么我要把这个字段存放在以上8个位置之一，如果不用HashCode而任意存放，那么当查找时就需要到8个位置中去挨个查找。使用HashCode则效率会快很多，把ID的HashCode%8，然后把ID存放在取得余数的那个位置，然后每次查找该类的时候都可以通过ID的HashCode%8求余数直接找到存放的位置了。如果ID的HashCode%8算出来的位置上本身已经有数据了怎么办？这就取决于算法的实现了，比如ThreadLocal中的做法就是从算出来的位置向后查找第一个为空的位置，放置数据；HashMap的做法就是通过链式结构连起来。反正，只要保证放的时候和取的时候的算法一致就行了。如果ID的HashCode%8相等怎么办（这种对应的是上句说的链式结构的场景）？这时候就需要定义equals了。先通过HashCode%8来判断类在哪一个位置，再通过equals来在这个位置上寻找需要的类。对比两个类的时候也差不多，先通过HashCode比较，假如HashCode相等再判断equals。如果两个类的HashCode都不相同，那么这两个类必定是不同的。

再举个实际的例子Set。我们知道Set里面的元素是不可以重复的，那么如何做到？Set是根据equals()方法来判断两个元素是否相等的。比方说Set里面已经有1000个元素了，那么第1001个元素进来的时候，最多可能调用1000次equals方法，如果equals方法写得复杂，对比的东西特别多，那么效率会大大降低。使用HashCode就不一样了，比方说HashSet，底层是基于HashMap实现的，先通过HashCode取一个模，这样一下子就固定到某个位置了，如果这个位置上没有元素，那么就可以肯定HashSet中必定没有和新添加的元素equals的元素，就可以直接存放了，都不需要比较；如果这个位置上有元素了，逐一比较，比较的时候先比较HashCode，HashCode都不同接下去都不用比了，肯定不一样，HashCode相等，再equals比较，没有相同的元素就存，有相同的元素就不存。如果原来的Set里面有相同的元素，只要HashCode的生成方式定义得好（不重复），不管Set里面原来有多少元素，只需要执行一次的equals就可以了。这样一来，实际调用equals方法的次数大大降低，提高了效率。

所以hashCode在上面扮演的角色为寻域（寻找某个对象在集合中区域位置）。hashCode可以将集合分成若干个区域，每个对象都可以计算出他们的hash码，可以将hash码分组，每个分组对应着某个存储区域，根据一个对象的hash码就可以确定该对象所存储区域，这样就大大减少查询匹配元素的数量，提高了查询效率。

即hashCode() 的作用是获取哈希码，也称为散列码；它实际上是返回一个int整数。这个哈希码的作用是确定该对象在哈希表中的索引位置。

二、hashCode对于一个对象的重要性

hashCode() 定义在JDK的Object.java中，这就意味着Java中的任何类都包含有hashCode() 函数。
虽然，每个Java类都包含hashCode() 函数。但是，仅仅当创建某个“类的散列表”(关于“散列表”见下面说明)时，该类的hashCode() 才有用(作用是：确定该类的每一个对象在散列表中的位置；其它情况下(例如，创建类的单个对象，或者创建类的对象数组等等)，类的hashCode() 没有作用。
上面的散列表，指的是：Java集合中本质是散列表的类，如HashMap，Hashtable，HashSet。

也就是说：hashCode() 在散列表中才有用，在其它情况下没用。在散列表中hashCode() 的作用是获取对象的散列码，进而确定该对象在散列表中的位置。

OK！至此，我们搞清楚了：hashCode()的作用是获取散列码。但是，散列码是用来干什么的呢？这里简单的介绍一下散列码的作用。

我们都知道，散列表存储的是键值对(key-value)，它的特点是：能根据“键”快速的检索出对应的“值”。这其中就利用到了散列码！散列表的本质是通过数组实现的。当我们要获取散列表中的某个“值”时，实际上是要获取数组中的某个位置的元素。而数组的位置，就是通过“键”来获取的；更进一步说，数组的位置，是通过“键”对应的散列码计算得到的。

下面我以HashTable为例阐述hashCode对于一个对象的重要性。

一个对象势必会存在若干个属性，如何选择属性来进行散列考验着一个人的设计能力。如果我们将所有属性进行散列，这必定会是一个糟糕的设计，因为对象的hashCode方法无时无刻不是在被调用，如果太多的属性参与散列，那么需要的操作数时间将会大大增加，这将严重影响程序的性能。但是如果较少属相参与散列，散列的多样性会削弱，会产生大量的散列“冲突”，除了不能够很好的利用空间外，在某种程度也会影响对象的查询效率。其实这两者是一个矛盾体，散列的多样性会带来性能的降低。

那么如何对对象的hashCode进行设计，LZ也没有经验。从网上查到了这样一种解决方案：设置一个缓存标识来缓存当前的散列码，只有当参与散列的对象改变时才会重新计算，否则调用缓存的hashCode，这样就可以从很大程度上提高性能。

在HashTable计算某个对象在table[]数组中的索引位置，其代码如下：

int index = (hash & 0x7FFFFFFF) % tab.length;

为什么要&0x7FFFFFFF？因为某些对象的hashCode可能会为负值，与0x7FFFFFFF进行与运算可以确保index为一个正数。通过这步我可以直接定位某个对象的位置，所以从理论上来说我们是完全可以利用hashCode直接定位对象的散列表中的位置，但是为什么会存在一个key-value的键值对，利用key的hashCode来存入数据而不是直接存放value呢？这就关系HashTable性能问题的最重要的问题:Hash冲突！

我们知道冲突的产生是由于不同的对象产生了相同的散列码，假如我们设计对象的散列码可以确保99.999999999%的不重复，但是有一种绝对且几乎不可能遇到的冲突你是绝对避免不了的。我们知道hashcode返回的是int，它的值只可能在int范围内。如果我们存放的数据超过了int的范围呢？这样就必定会产生两个相同的index，这时在index位置处会存储两个对象，我们就可以利用key本身来进行判断。所以具有相索引的对象，在该index位置处存在多个对象，我们必须依靠key的hashCode和key本身来进行区分。

三、equals()的作用

equals() 的作用是 用来判断两个对象是否相等。

equals() 定义在JDK的Object.java中。通过判断两个对象的地址是否相等(即，是否是同一个对象)来区分它们是否相等。源码如下：

public boolean equals(Object obj) {

    return (this == obj);

}

既然Object.java中定义了equals()方法，这就意味着所有的Java类都实现了equals()方法，所有的类都可以通过equals()去比较两个对象是否相等。但是，我们已经说过，使用默认的“equals()”方法，等价于“==”方法。因此，我们通常会重写equals()方法：若两个对象的内容相等，则equals()方法返回true；否则，返回fasle。

下面根据“类是否覆盖equals()方法”，将它分为2类。
(01) 若某个类没有覆盖equals()方法，当它的通过equals()比较两个对象时，实际上是比较两个对象是不是同一个对象。这时，等价于通过“==”去比较这两个对象。
(02) 我们可以覆盖类的equals()方法，来让equals()通过其它方式比较两个对象是否相等。通常的做法是：若两个对象的内容相等，则equals()方法返回true；否则，返回fasle。

下面，举例对上面的2种情况进行说明。

1、"没有覆盖equals()方法"的情况

代码如下：

package com.demo;

public class EqualsTest1 {

    /**

     * Person类

     * @author lixiaoxi

     *

     */

    private static class Person{

        int age;

        String name;

        public Person(String name, int age) {

            this.name = name;

            this.age = age;

        }

        public String toString() {

            return name + " - " +age;

        }

    }

    public static void main(String[] args) {

        // 新建2个相同内容的Person对象，

        // 再用equals比较它们是否相等

        Person p1 = new Person("eee", 100);

        Person p2 = new Person("eee", 100);

        System.out.printf("%s\n", p1.equals(p2));

    }

}

运行结果：false

结果分析：
我们通过 p1.equals(p2) 来“比较p1和p2是否相等时”。实际上，调用的Object.java的equals()方法，即调用的 (p1==p2) 。它是比较“p1和p2是否是同一个对象”。而由 p1 和 p2 的定义可知，它们虽然内容相同；但它们是两个不同的对象！因此，返回结果是false。

2、"覆盖equals()方法"的情况

我们修改上面的EqualsTest1.java：覆盖equals()方法。

代码如下：

package com.demo;

public class EqualsTest2 {

    /**

     * Person类

     * @author lixiaoxi

     *

     */

    private static class Person{

        int age;

        String name;

        public Person(String name, int age) {

            this.name = name;

            this.age = age;

        }

        public String toString() {

            return name + " - " +age;

        }

        /**

         * 覆盖equals方法

         */

        @Override

        public boolean equals(Object obj){

            if(obj == null){

                return false;

            }

            //如果是同一个对象返回true，反之返回false

            if(this == obj){

                return true;

            }

            //判断是否类型相同

            if(this.getClass() != obj.getClass()){

                return false;

            }

            Person person = (Person)obj;

            return name.equals(person.name) && age==person.age;

        }

    }

    public static void main(String[] args) {

        // 新建2个相同内容的Person对象，

        // 再用equals比较它们是否相等

        Person p1 = new Person("eee", 100);

        Person p2 = new Person("eee", 100);

        System.out.printf("%s\n", p1.equals(p2));

    }

}

运行结果：true

结果分析：

我们在EqualsTest2.java 中重写了Person的equals()函数：当两个Person对象的 name 和 age 都相等，则返回true。因此，运行结果返回true。

讲到这里，顺便说一下java对equals()的要求。有以下几点：

1. 对称性：如果x.equals(y)返回是"true"，那么y.equals(x)也应该返回是"true"。
2. 反射性：x.equals(x)必须返回是"true"。
3. 类推性：如果x.equals(y)返回是"true"，而且y.equals(z)返回是"true"，那么z.equals(x)也应该返回是"true"。
4. 一致性：如果x.equals(y)返回是"true"，只要x和y内容一直不变，不管你重复x.equals(y)多少次，返回都是"true"。
5. 非空性，x.equals(null)，永远返回是"false"；x.equals(和x不同类型的对象)永远返回是"false"。

四、equals()与==的区别

== : 它的作用是判断两个对象的地址是不是相等。即，判断两个对象是不是同一个对象。

equals() : 它的作用也是判断两个对象是否相等。但它一般有两种使用情况(上面已详细介绍过)：
情况1，类没有覆盖equals()方法。则通过equals()比较该类的两个对象时，等价于通过“==”比较这两个对象。
情况2，类覆盖了equals()方法。一般，我们都覆盖equals()方法来比较两个对象的内容相等；若它们的内容相等，则返回true(即，认为这两个对象相等)。

下面，通过示例比较它们的区别。

代码如下：

package com.demo;

public class EqualsTest3 {

    /**

     * Person类

     * @author lixiaoxi

     *

     */

    private static class Person{

        int age;

        String name;

        public Person(String name, int age) {

            this.name = name;

            this.age = age;

        }

        public String toString() {

            return name + " - " +age;

        }

        /**

         * 覆盖equals方法

         */

        @Override

        public boolean equals(Object obj){

            if(obj == null){

                return false;

            }

            //如果是同一个对象返回true，反之返回false

            if(this == obj){

                return true;

            }

            //判断是否类型相同

            if(this.getClass() != obj.getClass()){

                return false;

            }

            Person person = (Person)obj;

            return name.equals(person.name) && age==person.age;

        }

    }

    public static void main(String[] args) {

        // 新建2个相同内容的Person对象，

        // 再用equals比较它们是否相等

        Person p1 = new Person("eee", 100);

        Person p2 = new Person("eee", 100);

        System.out.printf("p1.equals(p2) : %s\n", p1.equals(p2));

        System.out.printf("p1==p2 : %s\n", p1==p2);

    }

}

运行结果：

p1.equals(p2) : true

p1==p2 : false

结果分析：
在EqualsTest3.java 中：
(01) p1.equals(p2) 这是判断p1和p2的内容是否相等。因为Person覆盖equals()方法，而这个equals()是用来判断p1和p2的内容是否相等，恰恰p1和p2的内容又相等；因此，返回true。

(02) p1==p2 这是判断p1和p2是否是同一个对象。由于它们是各自新建的两个Person对象；因此，返回false。

五、hashCode() 和 equals()的关系

我们以“类的用途”来将“hashCode() 和 equals()的关系”分2种情况来说明。

1、第一种不会创建“类对应的散列表”

这里所说的“不会创建类对应的散列表”是说：我们不会在HashSet, Hashtable, HashMap等等这些本质是散列表的数据结构中，用到该类。例如，不会创建该类的HashSet集合。

在这种情况下，该类的“hashCode() 和 equals() ”没有半毛钱关系的！这种情况下，equals() 用来比较该类的两个对象是否相等。而hashCode() 则根本没有任何作用，所以，不用理会hashCode()。

下面，我们通过示例查看类的两个对象相等以及不等时hashCode()的取值。

代码如下：

package com.demo;

/**

 * @desc 比较equals() 返回true 以及 返回false时， hashCode()的值。

 * @author lixiaoxi

 *

 */

public class NormalHashCodeTest {

      /**

     * @desc Person类。

     */

    private static class Person {

        int age;

        String name;

        public Person(String name, int age) {

            this.name = name;

            this.age = age;

        }

        public String toString() {

            return name + " - " +age;

        }

        /**

         * @desc 覆盖equals方法

         */

        public boolean equals(Object obj){

            if(obj == null){

                return false;

            }  

            //如果是同一个对象返回true，反之返回false

            if(this == obj){

                return true;

            }  

            //判断是否类型相同

            if(this.getClass() != obj.getClass()){

                return false;

            }  

            Person person = (Person)obj;

            return name.equals(person.name) && age==person.age;

        }

    }

    public static void main(String[] args) {

        // 新建2个相同内容的Person对象，

        // 再用equals比较它们是否相等

        Person p1 = new Person("eee", 100);

        Person p2 = new Person("eee", 100);

        Person p3 = new Person("aaa", 200);

        System.out.printf("p1.equals(p2) : %s; p1(%d) p2(%d)\n", p1.equals(p2), p1.hashCode(), p2.hashCode());

        System.out.printf("p1.equals(p3) : %s; p1(%d) p3(%d)\n", p1.equals(p3), p1.hashCode(), p3.hashCode());

    }

}

运行结果：

p1.equals(p2) : true; p1(30961619) p2(521452)

p1.equals(p3) : false; p1(30961619) p3(29744585)

从结果也可以看出：p1和p2相等的情况下，hashCode()也不一定相等。

2、第二种会创建“类对应的散列表”

这里所说的“会创建类对应的散列表”是说：我们会在HashSet, Hashtable, HashMap等等这些本质是散列表的数据结构中，用到该类。例如，会创建该类的HashSet集合。

在这种情况下，该类的“hashCode() 和 equals() ”是有关系的：
1)、如果两个对象相等，那么它们的hashCode()值一定相同。这里的相等是指，通过equals()比较两个对象时返回true。
2)、如果两个对象hashCode()相等，它们并不一定相等。
因为在散列表中，hashCode()相等，即两个键值对的哈希值相等。然而哈希值相等，并不一定能得出键值对相等。补充说一句：“两个不同的键值对，哈希值相等”，这就是哈希冲突。

此外，在这种情况下。若要判断两个对象是否相等，除了要覆盖equals()之外，也要覆盖hashCode()函数。否则，equals()无效。例如，创建Person类的HashSet集合，必须同时覆盖Person类的equals() 和 hashCode()方法。如果单单只是覆盖equals()方法。我们会发现，equals()方法没有达到我们想要的效果。

代码如下：

package com.demo;

import java.util.HashSet;

/**

 * @desc 比较equals() 返回true 以及 返回false时， hashCode()的值。

 * @author lixiaoxi

 *

 */

public class ConflictHashCodeTest1 {

     /**

     * @desc Person类。

     */

    private static class Person {

        int age;

        String name;

        public Person(String name, int age) {

            this.name = name;

            this.age = age;

        }

        public String toString() {

            return "("+name + ", " +age+")";

        }

        /**

         * @desc 覆盖equals方法

         */

        @Override

        public boolean equals(Object obj){

            if(obj == null){

                return false;

            }  

            //如果是同一个对象返回true，反之返回false

            if(this == obj){

                return true;

            }  

            //判断是否类型相同

            if(this.getClass() != obj.getClass()){

                return false;

            }  

            Person person = (Person)obj;

            return name.equals(person.name) && age==person.age;

        }

    }

    public static void main(String[] args) {

        // 新建Person对象，

        Person p1 = new Person("eee", 100);

        Person p2 = new Person("eee", 100);

        Person p3 = new Person("aaa", 200);

        // 新建HashSet对象

        HashSet set = new HashSet();

        set.add(p1);

        set.add(p2);

        set.add(p3);

        // 比较p1 和 p2， 并打印它们的hashCode()

        System.out.printf("p1.equals(p2) : %s; p1(%d) p2(%d)\n", p1.equals(p2), p1.hashCode(), p2.hashCode());

        // 打印set

        System.out.printf("set:%s\n", set);

    }

}

运行结果：

p1.equals(p2) : true; p1(13905160) p2(30961619)

set:[(aaa, 200), (eee, 100), (eee, 100)]

结果分析：
我们重写了Person的equals()。但是，很奇怪的发现：HashSet中仍然有重复元素：p1 和 p2。为什么会出现这种情况呢？这是因为虽然p1 和 p2的内容相等，但是它们的hashCode()不等；所以，HashSet在添加p1和p2的时候，认为它们不相等。

下面，我们同时覆盖equals() 和 hashCode()方法。

代码如下：

package com.demo;

import java.util.HashSet;

/**

 * @desc 比较equals() 返回true 以及 返回false时， hashCode()的值。

 * @author lixiaoxi

 *

 */

public class ConflictHashCodeTest2 {

    /**

     * @desc Person类。

     */

    private static class Person {

        int age;

        String name;

        public Person(String name, int age) {

            this.name = name;

            this.age = age;

        }

        public String toString() {

            return name + " - " +age;

        }

        /**

         * @desc重写hashCode

         */

        @Override

        public int hashCode(){

            int nameHash =  name.toUpperCase().hashCode();

            return nameHash ^ age;

        }

        /**

         * @desc 覆盖equals方法

         */

        @Override

        public boolean equals(Object obj){

            if(obj == null){

                return false;

            }  

            //如果是同一个对象返回true，反之返回false

            if(this == obj){

                return true;

            }  

            //判断是否类型相同

            if(this.getClass() != obj.getClass()){

                return false;

            }  

            Person person = (Person)obj;

            return name.equals(person.name) && age==person.age;

        }

    }

    public static void main(String[] args) {

        // 新建Person对象，

        Person p1 = new Person("eee", 100);

        Person p2 = new Person("eee", 100);

        Person p3 = new Person("aaa", 200);

        Person p4 = new Person("EEE", 100);

        // 新建HashSet对象

        HashSet set = new HashSet();

        set.add(p1);

        set.add(p2);

        set.add(p3);

        // 比较p1 和 p2， 并打印它们的hashCode()

        System.out.printf("p1.equals(p2) : %s; p1(%d) p2(%d)\n", p1.equals(p2), p1.hashCode(), p2.hashCode());

        // 比较p1 和 p4， 并打印它们的hashCode()

        System.out.printf("p1.equals(p4) : %s; p1(%d) p4(%d)\n", p1.equals(p4), p1.hashCode(), p4.hashCode());

        // 打印set

        System.out.printf("set:%s\n", set);

    }

}

运行结果：

p1.equals(p2) : true; p1(68545) p2(68545)

p1.equals(p4) : false; p1(68545) p4(68545)

set:[aaa - 200, eee - 100]

结果分析：
这下，equals()生效了，HashSet中没有重复元素。
比较p1和p2，我们发现：它们的hashCode()相等，通过equals()比较它们也返回true。所以，p1和p2被视为相等。
比较p1和p4，我们发现：虽然它们的hashCode()相等；但是，通过equals()比较它们返回false。所以，p1和p4被视为不相等。

码农公寓

相关文章