stream使用

stream流式计算

在Java1.8之前还没有stream流式算法的时候,我们要是在一个放有多个User对象的list集合中,将每个User对象的主键ID取出,组合成一个新的集合,首先想到的肯定是遍历,如下:

List<Long> userIdList = new ArrayList<>();
for (User user: list) {
     userIdList.add(user.id);
}

或者在1.8有了lambda表达式以后,我们会这样写:

List<Long> userIdList = new ArrayList<>();
list.forEach(user -> list.add(user.id));

List<Integer> userIdList = new ArrayList<>(Arrays.asList(0,1,2,3));
userIdList.forEach(item -> {
    //也可以做一些业务逻辑
    if(item.equals(1)){
        System.out.println("nihao");
    }
});

在有了stream之后,我们还可以这样写:

List<Long> userIdList = list.stream().map(User::getId).collect(Collectors.toList());

一行代码直接搞定,是不是很方便呢。那么接下来。我们就一起看一下stream这个流式算法的新特性吧。

由上面的例子可以看出,java8的流式处理极大的简化了对于集合的操作,实际上不光是集合,包括数组、文件等,只要是可以转换成流,我们都可以借助流式处理,类似于我们写SQL语句一样对其进行操作。java8通过内部迭代来实现对流的处理,一个流式处理可以分为三个部分:转换成流、中间操作、终端操作。如下图:

以集合为例,一个流式处理的操作我们首先需要调用stream()函数将其转换成流,然后再调用相应的中间操作达到我们需要对集合进行的操作,比如筛选、转换等,最后通过终端操作对前面的结果进行封装,返回我们需要的形式。

public class Demo {
    public static void main(String[] args) {
        User u1 = new User(1,"a",21);
        User u2 = new User(2,"b",22);
        User u3 = new User(3,"c",23);
        User u4 = new User(4,"d",24);
        User u5 = new User(5,"e",25);
        User u6 = new User(6,"f",26);
        //集合用来存储数据
        List<User> users = Arrays.asList(u1, u2, u3, u4, u5,u6);
        //stream流用来计算
        lambda表达式 链式编程 函数式接口 stream流式计算全都用到了
        users.stream()
                .filter(u->{return u.getId()%2==0;})   //ID必须是偶数
                .filter(u->{return u.getAge()>23;})    //年龄大于23岁
                .map(u->{return u.getName().toUpperCase();})   //用户名首字母大写
                .sorted((uu1,uu2)->{return uu2.compareTo(uu1);})  //用户名字母倒着排序
                .limit(1)  //只输出一个用户
                .forEach(System.out::println);
    }
}
class User{
    int id;
    String name;
    int age;
 
    public User(){}
    public User(int id,String name,int age){
        this.id=id;
        this.name=name;
        this.age=age;
    }
 
    public int getId() {
        return id;
    }
 
    public int getAge() {
        return age;
    }
 
    public String getName() {
        return name;
    }
 
    @Override
    public String toString() {
        return "user = "  + "{" + id +","+ name +"," + age + "}";
    }
}

下面讲对Stream进行详解

一、什么是stream

Java 8 是一个非常成功的版本,这个版本新增的Stream,配合同版本出现的Lambda ,给我们操作集合(Collection)提供了极大的便利。stream流实际上就是一个高级迭代器,可以对集合执行非常复杂的查找/筛选/过滤、排序、聚合和映射数据等操作。 

Java8 Stream 使用的是函数式编程模式,所以大部分流操作都支持 lambda 表达式作为参数,正确理解,应该说是接受一个函数式接口的实现作为参数。例如:

filter(s -> s.startsWith("c"));

以上面代码为例,可以对流进行中间操作或者终端操作

  • 中间操作:会再次返回一个流,所以,我们可以链接多个中间操作,注意这里是不用加分号的。上图中的filter 过滤,map 对象转换,sorted 排序等就属于中间操作。
  • 终端操作是对流操作的一个结束动作,一般返回 void 或者一个非流的结果。上图中的 forEach循环 就是一个终止操作。

Stream流有一些特性:

  1. Stream流不是一种数据结构,不保存数据,它只是在原数据集上定义了一组操作。
  2. 这些操作是惰性的,即每当访问到流中的一个元素,才会在此元素上执行这一系列操作。
  3. Stream不保存数据,故每个Stream流只能使用一次

二、不同类型的stream流

可以从各种数据源中创建 Stream 流,其中以 Collection 集合最为常见。如 List 和 Set 均支持 stream() 方法来创建顺序流(又称为串行流)或者是并行流。

先介绍串行流:

Arrays.asList("a1", "a2", "a3")   //asList源码就是一个ArrayList集合
        .stream() // 创建流
        .findFirst() // 找到第一个元素
        .ifPresent(System.out::println);  // 如果存在,即输出

 在集合上调用stream()方法会返回一个普通的 Stream 流。但是, 大可不必刻意地创建一个集合,再通过集合来获取 Stream 流,这种方式效率远远比上方的写法高,如下:

Stream.of("a1", "a2", "a3")
    .findFirst()
    .ifPresent(System.out::println);

可以通过 Stream.of() 从一堆对象中创建 Stream 流,除了常规对象流之外,Java 8还附带了一些特殊类型的流,用于处理原始数据类型int,long以及double,它们就是IntStream,LongStream还有DoubleStream。其中,IntStreams.range()方法还可以被用来取代常规的 for 循环,

IntStream.range(1, 4)       // 相当于 for (int i = 1; i < 4; i++) {}
    .mapToObj(i ->  + i*i)
    .forEach(System.out::println); 

将常规对象流转换为原始类型流,这个时候,中间操作 mapToInt()mapToLong() 以及mapToDouble,

 Stream.of("3", "2", "5")
        .mapToInt(Integer::parseInt) // 转成 int 基础类型类型流
        .forEach(System.out::println); 
        
        System.out.println("==============");
        
        Stream.of(1.0, 2.0, 3.0)
        .mapToInt(Double::intValue) // double 类型转 int
        .forEach(System.out::println); // for 循环打印

将原始类型流装换成对象流,可以使用 mapToObj(),

IntStream.range(1, 4)
    .mapToObj(i -> "a" + i) // for 循环 1->4, 拼接前缀 a
    .forEach(System.out::println);

三、Stream 流的处理顺序

中间操作的有个重要特性 —— 延迟性

 java的Stream以延迟性著称。他们被刻意设计成这样,即延迟操作,有其独特的原因:Stream就像一个黑盒,它接收请求生成结果。当我们向一个Stream发起一系列的操作请求时,这些请求只是被一一保存起来。只有当我们向Stream发起一个终端操作是,才会实际地进行计算。

举个例子:

Stream.of("d2", "a2", "b1", "b3", "c")
        .filter(s -> {
            System.out.println("filter: " + s);
            return true;
        });

上面这个代码没有终端操作,根本不会执行任何代码,不会有任何输出,于是添加 一行forEach终端操作如下就可以输出了

Stream.of("d2", "a2", "b1", "b3", "c")
        .filter(s -> {
            System.out.println("filter: " + s);
            return true;
        })
        .forEach(s -> System.out.println("forEach: " + s));

输出内容如下,filter和forEach的内容都能正常输出:
filter: d2
forEach: d2
filter: a2
forEach: a2
filter: b1
forEach: b1
filter: b3
forEach: b3
filter: c
forEach: c

这里很有趣,输出的结果却是随着链条垂直移动的,当 Stream 开始处理 d2 元素时,它实际上会在执行完 filter 操作后,再紧接着执行 forEach 操作,接着才会处理第二个元素。
注意有个方法是水平执行的,例如sorted,题外话:平常开发中对于这些中间操作方法的位置顺序也要注意下,正确放置也能大大提高性能,就像sql语句一样,where条件放置顺序也会影响查询速度。

为什么要设计成这样呢?

原因是出于性能的考虑。这样设计可以减少对每个元素的实际操作数,举个更清楚的例子,

Stream.of("d2", "a2", "b1", "b3", "c")
	    .map(s -> {
	        System.out.println("map: " + s);
	        return s.toUpperCase(); // 转大写
	    })
	    .anyMatch(s -> {
	        System.out.println("anyMatch: " + s);
	        return s.startsWith("A"); // 过滤出以 A 为前缀的元素
	    });
		/*
		map: d2
		anyMatch: D2
		map: a2
		anyMatch: A2
		 */

方法依旧是先执行map,再anyMatch,终端操作 anyMatch()表示任何一个元素以 A 为前缀,返回为 true,就停止循环。从 d2 开始匹配,接着循环到 a2 的时候,返回为 true ,于是停止循环。所以这里只输出了4次,如果是水平移动呢,需要把map全部执行,5次,再执行anyMatch方法2次,一共7次,所以很明显减少了不必要的操作次数。

 四、数据流复用问题

 Stream 流是不能被复用的,一旦你调用任何终端操作,流就会关闭,再调用 noneMatch 就会抛出异常。

Stream<String> stream =
			    Stream.of("d2", "a2", "b1", "b3", "c")
			        .filter(s -> s.startsWith("a"));
 
			stream.anyMatch(s -> true);    // ok
			stream.noneMatch(s -> true);   // exception

当我们对 stream 调用了 anyMatch 终端操作以后,流即关闭了,再调用 noneMatch 就会抛出异常:

Exception in thread "main" java.lang.IllegalStateException: stream has already been operated upon or closed
    at java.util.stream.AbstractPipeline.evaluate(AbstractPipeline.java:229)
    at java.util.stream.ReferencePipeline.noneMatch(ReferencePipeline.java:459)
    at test.Demo.main(Demo.java:13)

所以可以通过 Supplier 来包装一下流,通过 get() 方法来构建一个新的 Stream 流,通过构造一个新的流,来避开流不能被复用的限制,如下所示:

Supplier<Stream<String>> streamSupplier =
    () -> Stream.of("d2", "a2", "b1", "b3", "c")
            .filter(s -> s.startsWith("a"));
 
streamSupplier.get().anyMatch(s -> true);   // ok
streamSupplier.get().noneMatch(s -> true);  // ok

五、工作实践

实际工作中,stream经常用到,列举一些实际工作的业务场景:

场景一:计算两个集合的重复数据有多少

long a = sourceMpList.stream().filter(mpList::contains).count();

场景二:获取一个集合中的某个属性

集合:List<TestDTO> testVo,获取其中的某属性值存入一个专门的集合

List<String> sourList = testVo.stream().map(TestDTO::getName).collect(Collectors.toList());

当然,另一种普通写法为:

List<String> sourList = new ArrayList<>();
for (String s : testVo) {
    sourList.add(s.toUpperCase());
}

场景三:过滤掉为null的字段值以及去重

集合:List<Integer> commPortList;

List<Integer> portList = commPortList.stream().distinct().filter(Objects::nonNull).collect(Collectors.toList());
场景四:从一个集合中剔除多个其他集合的值
List<String> listAll = Stream.of("value1", "value2", "value3").collect(Collectors.toList());
List<String> list1 = Stream.of("value1").collect(Collectors.toList());
List<String> list2 = Stream.of("value2").collect(Collectors.toList());
//从listAll剔除掉list1与list2的数据,找出未使用的
List<String> list3 = listAll.stream().filter(item -> !list1.contains(item) && !list2.contains(item)).collect(Collectors.toList());
System.out.println(list3);  //[value3]
场景五: 判断集合会否存在重复以及空值
List<Integer> list1 = new ArrayList<>(Arrays.asList(1,1,2,3,4,5,null));
long list2 = list1.stream().distinct().count(); //6
//判断设备编号会否存在重复以及空值
if(list1.size()>list2 || list1.contains(null) || list1.contains("")){

}
场景六:关于boxed用法

首先boxed的源码如下:

@Override
public final Stream<Integer> boxed() {
    return mapToObj(Integer::valueOf);
}


@Override
public final Stream<Double> boxed() {
   return mapToObj(Double::valueOf);
}

 boxed的作用就是将int等类型的stream转成了Integer等类型的Stream,

也就是基本类型流转换位对象流,需要使用boxed方法

流库中有直接存储基本类型值的类型IntStream、LongStream和DoubleStream,比如

IntStream是int类型的流。stream<Integer 是Integer类型的流

现在定义一个Integer类型的数据流,用来存IntStream的流,必须使用boxed

IntStream stream = IntStream.of(1,1,2,3,5);
List<Integer> integers = stream.boxed().collect(Collectors.toList());

比如double转Double

List<Double> list = Arrays.stream(new double[]{-1.0, -0.5, 0,0.5})
        .boxed().collect(Collectors.toList());
 场景七:合并两个集合值
List<Integer> list1 = new ArrayList<>(Arrays.asList(1,1,2));
List<Integer> list2 = new ArrayList<>(Arrays.asList(3,4,5,null));
List<Integer> list3 = Stream.of(list1,list2).flatMap(Collection::stream).distinct().collect(Collectors.toList());
System.out.println(list3); //[1, 2, 3, 4, 5, null]
场景八: 如果一个流的集合数据过大,根据需要进行拆分,进而通过循环或者多线程来处理数据
List<Integer> list1 = new ArrayList<>(Arrays.asList(0,1,2,3));
System.out.println(Lists.partition(list1,2));
//[[0, 1], [2, 3]]
场景九: 根据equals过滤出想要的value值或者集合
User user = new User(1,"mac");
List<User> list = new ArrayList<>();
list.add(user);
//根据需要输出想要的value值
Integer value = list.stream().filter(p->p.getName().equals("mac"))
                .collect(Collectors.toList()).get(0).getAge();
System.out.println(value); // 1 

或者这样写

List<Integer> list = new ArrayList<>(Arrays.asList(1,2));
List<User> userList = new ArrayList<>();
userList.add(new User(1,"mac1"));
userList.add(new User(2,"mac2"));
userList.add(new User(3,"mac3"));
List<User> list1 = userList.stream().filter(
        user -> Objects.equals(list.get(1),user.getAge()))
                .collect(Collectors.toList());
System.out.println(list1);
// [User(age=2, name=mac2)]
场景十: 声明一个带对象的集合并对该对象的属性进行封装
List<Integer> list = new ArrayList<>(Arrays.asList(1,2));
List<User> userList = list.stream().map(id->{
    //对userList属性进行封装
    User user = new User();
    user.setAge(id);
    user.setName("mac");
    return user;
}).collect(Collectors.toList());
System.out.println(userList);
//[User(age=1, name=mac), User(age=2, name=mac)]
场景十一: noneMatch、anyMatch、allMatch

anyMatch:判断的条件里,任意一个元素成功,返回true

allMatch:判断条件里的元素,所有的都是,返回true

noneMatch:与allMatch相反,判断条件里的元素,所有的都不是,返回true

List<Integer> list = new ArrayList<>(Arrays.asList(1,2));
System.out.println(list.stream().noneMatch(x->1==x)); //false


Stream<String> stream = Stream.of("aaa", "bbb", "ccc");
// 判断stream中其中任何一个元素中只要有包含b字符串或者l字符串就返回true
boolean isMatch = stream.anyMatch(str -> str.contains("b") || str.contains("l"));
System.out.println(isMatch);  // true
场景十二:findFirst,查找集合中符合条件的第一个对象

 Optional<A> firstA= AList.stream() 
                          .filter(a -> "小明".equals(a.getUserName())) 
                          .findFirst();

关于Optional,java API中给了解释,一个容器对象,它可能包含也可能不包含非空值。如果存在一个值,isPresent()将返回true;

List<Integer> list = new ArrayList<>(Arrays.asList(1,2));
Optional<Integer> a = list.stream().filter(p->p==1).findFirst();
if (a.isPresent()){  //true
    System.out.println("true");
}
场景十三:sorted,comparator

java8的lambda表达式排序,理应用comparing,多字段 后面增加thenComparing,默认排序规则为正序

现在有个排序需求:
a-倒序
b-当a相同时,正序
c-当b相同时,倒序

 List<UserCouponVo> newList = list.stream().sorted(Comparator
                    .comparing(UserCouponVo::getA,Comparator.reverseOrder())
                    .thenComparing(UserCouponVo::getB)
                    .thenComparing(UserCouponVo::getC,Comparator.reverseOrder())
            ).collect(Collectors.toList());

List<Yue> yueList = new ArrayList<>();
yueList.add(new Yue(4,1));
yueList.add(new Yue(2,2));
yueList.add(new Yue(6,3));
List<Yue> list1 = yueList.stream().sorted(Comparator.comparing(Yue::getA))
        .collect(Collectors.toList());
System.out.println(list1);
//[Yue(a=2, b=2), Yue(a=4, b=1), Yue(a=6, b=3)]

List<Yue> list = yueList.stream().sorted(Comparator.comparing(Yue::getA,
                        Comparator.reverseOrder()))
        .collect(Collectors.toList());
System.out.println(list);
//[Yue(a=6, b=3), Yue(a=4, b=1), Yue(a=2, b=2)]

如何a值分别为正序246,倒序642

场景十四:Collectors.groupingBy
List<User> userList = new ArrayList<>();
userList.add(new User(1,"mac1"));
userList.add(new User(2,"mac2"));
userList.add(new User(3,"mac3"));
userList.add(new User(3,"mac3"));
System.out.println(userList.stream().collect(Collectors.groupingBy(User::getAge)));
//{
// 1=[User(age=1, name=mac1)], 
// 2=[User(age=2, name=mac2)], 
// 3=[User(age=3, name=mac3), User(age=3, name=mac3)]
// }
场景十五: 批量修改某个集合的属性
List<User> userList = new ArrayList<>();
userList.add(new User(1,"mac1"));
userList.add(new User(2,"mac2"));
userList.stream().map(p->{p.setAge(2+p.getAge());return p;}).collect(Collectors.toList());
System.out.println(userList);
//[User(age=3, name=mac1), User(age=4, name=mac2)]

上一篇:torch.mean的使用方法


下一篇:时序数据库IoTDB:功能详解与行业应用