java 两个list 交集 并集 差集 去重复并集

需要明白List是引用类型,引用类型采用引用传递。

我们经常会遇到一些需求求集合的交集、差集、并集。例如下面两个集合:

List<String> list1 = new ArrayList<String>();
list1.add("1");
list1.add("2");

List<String> list2 = new ArrayList<String>();
list2.add("2");
list2.add("3");

1.求差集

例如,求List1中有的但是List2中没有的元素:

public static void test3(List list1,List list2){

  list1.removeAll(list2);

  System.out.println(list1);

}

结果:[1]

查看ArrayList的removeAll的源码

public boolean removeAll (Collection < ? > c){

  Object.requireNonNull(c);

  return batchRemove(c,false);

}

再查看batchRemove的源码:(如果传的第二个参数是false,保留差集;如果传的是true,保留的是交集)

private boolean batchRemove(Collection<?> c, boolean complement) {
  final Object[] elementData = this.elementData;
  int r = 0, w = 0;
  boolean modified = false;
  try {
    for (; r < size; r++)
      if (c.contains(elementData[r]) == complement)
        elementData[w++] = elementData[r];
  } finally {
    // Preserve behavioral compatibility with AbstractCollection,
    // even if c.contains() throws.
    if (r != size) {
      System.arraycopy(elementData,r,elementData, w,size - r);
      w += size - r;
    }
    if (w != size) {
      // clear to let GC do its work
      for (int i = w; i < size; i++)
        elementData[i] = null;
      modCount += size - w;
      size = w;
      modified = true;
    }
  }
  return modified;
}

是重新定义elementData数组的元素,下面代码的作用是将本集合中不包含另一个集合的元素重新加入元素,以此实现删除的功能(注意上面调用的方法传的参数是false,也就是不包含的元素得以保留,实现差集的功能)

if (c.contains(elementData[r]) == complement)
elementData[w++] = elementData[r];

2.求并集(不去重)---将一个集合全部加入另一个集合

public static void test(List list1,List list2){

  list1.addAll(list2);

  System.out.println(list1);

}

结果:[1、2、2、3]

查看ArayList的addAll()源码是数组复制:

public boolean addAll(Collection<? extends E> c) {
  Object[] a = c.toArray();
  int numNew = a.length;
  ensureCapacityInternal(size + numNew); // Increments modCount
  System.arraycopy(a, 0, elementData, size, numNew);
  size += numNew;
  return numNew != 0;
}

再查看System的arraycopy发现是一个native方法(本地方法):---其实system类的好多方法都是native方法

public static native void arraycopy(Object src,int srcPos,Object dest,int DestPos,int length);

 

 

3、求并集(去重)

  例如:求List1和List2的并集,并实现去重。

  思路是:先将list中与list2重复的去掉,之后将list2的元素全部添加进去。

public static void test1(List list1, List list2) {
        list1.removeAll(list2);
        list1.addAll(list2);
        System.out.println(list1);
    }
结果:[1、2、3]

4、求交集

  例如:求List1和List2中都有的元素。

public static void test2(List list1, List list2) {
        list1.retainAll(list2);
        System.out.println(list1);
    }
结果:[2]
在上面 1 的实验过程中,我们知道batchRemove(Collection,true)也是求交集,
所以猜想  retainAll 内部应该是调用 batchRemove(Collection,true),查看ArrayList的源码如下:
  public boolean retainAll(Collection<?> c) {
        Objects.requireNonNull(c);
        return batchRemove(c, true);
    }

上一篇:pandas这么多实用又常用的技能,还不快快收藏起来


下一篇:修改linux的最大文件句柄数限制