集合的总结

2024-03-29 10:54:34

集合的总结

1.集合和数组的比较

相同点：都可以存储多个元素，对外作为一个整体

不同点：

数组的容量固定无法动态改变；集合的容量可以动态改变（扩容）
数组可以存放基本数据类型和引用数据类型;集合只能存引用数据类型（涉及到自动装箱）
数组无法判断实际有多少元素，length只是告诉了数组的容量;集合可以判断实际存有多少元素，而对总容量不关心
数组采用顺序表的结构；集合有多种数据结构（顺序表，链表，哈希表，树等），多种特征（是否有序，是否唯一），不同的适用场合（查询快，便于删除，有序）
集合以类的形式存在，具有封装，继承，多态等类的特性，通过简单的方法和属性的调用即可实现各种复杂操作，提高了开发效率

2.ArrayList与LinkedList的联系和区别（或数组与链表的联系和区别）

联系：都实现了List接口；有序，不唯一

ArrayList：

特点：在内存中分配了连续的空间，实现了长度可变的数组

优点：遍历元素，随机访问元素效率高

缺点：添加删除需大量移动元素效率低，按照内容查找效率低

LinkedList：

特点：采用链表存储方式，底层是双向链表

优点：遍历元素，随机访问元素效率低

缺点：添加删除效率高，修改指针即可

3.哈希表的原理（HashMap的底层原理）

哈希表的特征：添加快，查询快（三步）
哈希表的结构:

JDK1.7:数组+链表

JDK1.8:数组+链表/红黑树（链表长度大于等于8）

哈希表的添加原理
1. 通过hashCode()计算哈希码
2. 通过哈希码计算在哈希表中的存储位置
3. 存入哈希表（处理冲突，借助equals()比较）
哈希表的查询原理

同哈希表的添加原理
其他

1.hashCode()和equals()的作用：
- hashCode()：计算哈希码，是一个整数，根据哈希码可以计算出数据在哈希表中的存储位置
- equals():往哈希表添加数据时，出现了冲突，要通过equals()进行比较，判断是否相同；查询时也要通过equals()进行比较，判断是否相同
2.如何减少冲突：

（1）表中记录数和哈希表的长度比例--装填因子

- 如果哈希表的空间远大于实际存储的记录数，会造成空间的浪费，如果选小了，容易造成冲突。

- 在实际情况中要根据最终存储的个数和关键字的分布特点来确定哈希表的大小。

- 事先不知道存储个数时，需动态维护哈希表的容量，此时可能需要重新计算Hash地址

装填因子=表中记录数/哈希表的长度

（2）装填因子越小，表明表中还有很多空单元，发生冲突的可能性小。

装填因子越大，发生冲突的可能性越大，查找时耗费的时间越多。

相关资料证明，装填因子在0.5左右时，Hash性能能达到最优。

所以装填因子一般取0.5

（3）哈希函数的选择

直接定址法平方取中法折叠法 除留取余法（y=x%11）

（4）处理冲突的方法

链地址法 开放地址法再散列法建立一个公共溢出区

3.如何产生不同数据类型的哈希码
- int 取自身。可看Integer源码
```
    public int hashCode() {
        return Integer.hashCode(value);
    }
 	public static int hashCode(int value) {
        return value;
    }
```
- double 3.24 ，4.67 取整不可以。可看Double源码
```
    public int hashCode() {
        return Double.hashCode(value);
    }
	public static int hashCode(double value) {
        long bits = doubleToLongBits(value);//转为long型
        return (int)(bits ^ (bits >>> 32));
    }
```
- String 将各个字符的码值相加不可以。可看String 源码
  
  abc：31 X (31 X（31 X 0+97）+98)+99
```
public int hashCode() {
        int h = hash;
        if (h == 0 && value.length > 0) {
            char val[] = value;

            for (int i = 0; i < value.length; i++) {
                h = 31 * h + val[i];
            }
            hash = h;
        }
        return h;
    }
```
- Student 先计算各个属性的哈希码，再进行某些相加相乘的运算
  
  String name; int age;

4.TreeMap的底层原理(红黑树的底层原理)

基本特征：

二叉树，二叉查找树，二叉平衡树，红黑树
每个节点的结构

添加原理：
1. 从根节点开始比较
2. 添加的过程就是构建二叉平衡树的过程，会自动平衡
3. 平衡离不开比较：外部比较器优先，然后是内部比较器，否则出错
查询原理基本同添加

5.Collection和Collections的区别

Collection是一个集合接口，存储一组不唯一，无序的对象。有两个子接口：List和Set
Collections是工具类，提供了很多静态方法，如对集合的搜索排序等

6.Vector和ArrayList的联系与区别

实现原理相同，功能相同，都是长度可变的数组结构，很多情况下可互用
区别
- Vector是早期的JDK接口；ArrayList是代替Vector的新接口
- Vector线程安全效率低下；ArrayList重速度轻安全，线程非安全
- 长度需增加时，Vector默认增1倍，ArrayList增加50%

7.HashMap和HashTable的联系与区别

实现原理相同，功能相同，底层都是哈希表，查询速度快，很多情况下可互用
区别
- HashTable是早期的JDK接口，HashMap是新版本JDK提供的接口
- HashTable继承了Dictionary类，HashMap实现了Map接口
- HashTable线程安全效率低，HashMap线程不安全效率高
- HashTable不允许NUll值，HashMap允许NUll值

8.各种集合类的特点

9.使用for循环和Iteator遍历的效率

对于ArrayList，使用for循环和Iteator遍历的效率基本一样
对于LinkedList，使用for循环和Iteator遍历时，Iteator的效率高

码农公寓

集合的总结

1.集合和数组的比较

2.ArrayList与LinkedList的联系和区别（或数组与链表的联系和区别）

3.哈希表的原理（HashMap的底层原理）

4.TreeMap的底层原理(红黑树的底层原理)

5.Collection和Collections的区别

6.Vector和ArrayList的联系与区别

7.HashMap和HashTable的联系与区别

8.各种集合类的特点

9.使用for循环和Iteator遍历的效率

相关文章