Java8 Stream新特性详解及实战

## 背景介绍


在阅读Spring Boot源代码时,发现Java 8的新特性已经被广泛使用,如果再不学习Java8的新特性并灵活应用,你可能真的要out了。为此,针对Java8的新特性,会更新一系列的文章,欢迎大家持续关注。

首先,我们来看一下Spring Boot源代码ConfigFileApplicationListener类中的一段代码:






private List<Profile> getOtherActiveProfiles(Set<Profile> activatedViaProperty) {  return Arrays.stream(this.environment.getActiveProfiles()).map(Profile::new)      .filter((profile) -> !activatedViaProperty.contains(profile))      .collect(Collectors.toList());}

这段代码怎么?够简洁明快吧,如果不使用Java8的新特性,想象一下得多少行代码才能实现?但如果没掌握或不了解Java8的新特性,这段代码读起来是不是很酸爽?

Java 8的API中新增了一个处理集合的抽象概念:Stream,中文称作“流”。它可以指定你希望对集合进行的操作,可以执行非常复杂的查找、过滤和映射数据等操作。使用起来就像使用SQL语句来对数据库执行查询操作一样。可以让你如行云流水一般写出简单、高效、干劲的代码。


## 什么是Stream

Stream 中文称为 ,通过将集合转换为这么一种叫做 “流” 的元素序列(注意是抽象概念),通过声明性方式,能够对集合中的每个元素进行一系列并行或串行的流水线操作。通俗来说就是你只用告诉“流”你需要什么,便在出口处等待结果接口。Java8 Stream新特性详解及实战上图为Steam操作的基本流程,在后面的学习过程中可反复与具体的代码进行对照,加深学习印象。


## Stream相关概念

Stream操作的过程中涉及到一些相关概念,先了解一下,方便后面统一称谓。

  • 元素:特定类型的对象,比如List里面放置的对象,会形成一个队列。Stream不会存储元素,只是按需计算。
  • 数据源:流的来源,对照上图中的集合,数组,I/O channel, 产生器generator等。
  • 聚合操作:类似SQL语句的各种过滤操作,对照上图中的filter、sorted、map等。
  • Pipelining:中文词义“流水线”,中间操作会返回流本身,跟我们之前所说的流式(fluent)编程一个概念,这样可对操作进行优化,比如延迟执行(laziness)和短路(short-circuiting)。
  • 内部迭代:传统遍历方式是通过Iterator或For-Each来完成,这是外部迭代。而Stream通过访问者模式(Visitor)实现了内部迭代。

需要注意的是在整个操作的过程中,聚合操作部分可以执行多次操作,但每次操作并不是像传统的集合遍历对集合里面的元素进行转换,而是将操作函数放入一个操作集合中,只有到最后一步(比如for-each打印)时才会一次性执行。

而流和迭代器类似,只能迭代一次。比如,当调用完collect方法之后,流便不能再使用了。

## stream操作方法分类

中间聚合操作:map (mapToInt, flatMap 等)、 filter、 distinct、 sorted、 peek、 skip、 parallel、 sequential、 unordered。

最终输出操作:forEach、 forEachOrdered、 toArray、 reduce、 collect、 min、 max、 count、iterator。

短路操作:anyMatch、 allMatch、 noneMatch、 findFirst、 findAny、 limit。

## 生成流

在 Java 8 中, 生成流有多种方法:Stream接口的静态工厂方法、集合提供的生成方法和其他特殊的生成方法。


### of方法

Stream接口的静态工厂方法主要通过重载的of方法:



public static<T> Stream<T> of(T... values);public static<T> Stream<T> of(T t)

of方法,其生成的Stream是有限长度的,Stream的长度为其内的元素个数。使用示例代码:



Stream<String> stringStream = Stream.of("公众号");Stream<String> stringsStream = Stream.of("关注","公众号", "程序新视界");


### generator方法

与of方法对应的generator方法生成的是无限长度的Stream,其元素是由Supplier接口提供的。


public static<T> Stream<T> generate(Supplier<T> s)

使用generate方法生成的Stream通常用于随机数和常量,或者需要前后元素间维持着某种状态信息的场景。把 Supplier 实例传递给 Stream.generate() 生成的 Stream,默认是串行(相对 parallel 而言)但无序的(相对 ordered 而言)。

示例代码如下:








Stream<Double> generateDouble = Stream.generate(Math::random);Stream<String> generateString = Stream.generate(new Supplier<String>() {      @Override      public String get() {      return "公众号:程序新视界";      }});

其实上面两种写法的效果是一样的,只不过第一种采用了Lambda表达式,简化了代码。


### iterate方法

iterate方法生成的也是无限长度的Stream,是通过函数f迭代对给指定的元素种子而产生无限连续有序Stream,其中包含的元素可以认为是:seed,f(seed),f(f(seed))无限循环。示例代码如下:


Stream.iterate(1,i -> i +1).limit(10).forEach(System.out::println);

打印结果为1,2,3,4,5,6,7,8,9,10。

上面的方法可以认为种子(seed)为1,f(seed)为在1的基础上“+1”,依次循环下去,直到达到limit的限制,最后生成对应的Stream。

### empty方法

empty方法生成一个空的Stream,不包含任何元素。

### Collection接口和数组的默认方法

Collection接口和数组中都提供了默认的生成Stream的方法。直接看源代码:
















// Collection中default Stream<E> stream() {    return StreamSupport.stream(spliterator(), false);}// 并行流操作default Stream<E> parallelStream() {    return StreamSupport.stream(spliterator(), true);}// Arrays中public static <T> Stream<T> stream(T[] array) {    return stream(array, 0, array.length);}public static <T> Stream<T> stream(T[] array, int startInclusive, int endExclusive) {    return StreamSupport.stream(spliterator(array, startInclusive, endExclusive), false);}


示例代码:










List<String> list = new ArrayList<>();list.add("欢迎关注");list.add("微信公众号");list.add("程序新视界");list.stream().forEach(System.out::println);
int[] nums = new int[]{1, 2, 3, 4, 5};Arrays.stream(nums).forEach(System.out::println);

### 其他生成方法

关于其他生成方法就不详细举例了,比如:Random.ints()、BitSet.stream()、JarFile.stream()、Pattern.splitAsStream(java.lang.CharSequence)、Files.lines(java.nio.file

.Path)等。


## 操作方法使用

关于操作方法就不进行详细的讲解,更多的以示例的形式展示如何使用。

### concat方法

合并两个Stream。如果输入Stream有序,则新Stream有序;如果其中一个Stream为并行,则新Stream为并行;如果关闭新Stream,原Stream都将执行关闭。


Stream.concat(Stream.of("欢迎","关注"),Stream.of("程序新视界")).forEach(System.out::println);


### distinct

Stream中元素去重。


Stream.of(1,1,1).distinct().forEach(System.out::println);

打印结果为1。

### filter

根据指定条件进行筛选过滤,留下满足条件的元素。


Stream.of(1, 2, 3, 4, 5).filter(i -> i >= 3).forEach(System.out::println);

打印结果为3,4,5。

### map

将Stream中的元素进行映射转换,比如将“a”转为“A”,期间生产了新的Stream。同时为了提升效率,官方也提供了封装好的方法:mapToDouble,mapToInt,mapToLong。



Stream.of("a","b","c").map(item -> item.toUpperCase()).forEach(System.out::println);Stream.of("a","b","c").map(String::toUpperCase).forEach(System.out::println);

打印结果为A,B,C。

### flatMap

将流中的每一个元素映射为一个流,再把每一个流连接成为一个流。期间原有的Stream的元素会被逐一替换。官方提供了三种原始类型的变种方法:flatMapToInt,flatMapToLong和flatMapToDouble。


Stream.of(1, 2, 3).flatMap(i -> Stream.of(i * 10)).forEach(System.out::println);

打印结果为10,20,30。

### peek

生成一个相同的Stream,并提供一个消费函数,当新Stream中的元素被消费(执行操作)时,该消费函数会在此之前先执行。


Stream.of(1, 2).peek(i -> System.out.println("peekCall:" + i)).forEach(System.out::println);

打印结果依次为:peekCall:1,1,peekCall:2,2。

### ship

跳过前N个元素,取剩余元素,如果没有则为空Stream。


Stream.of(1, 2, 3).skip(2).forEach(System.out::println);

打印结果为3。

### sorted

对Stream元素进行排序,可采用默认的sorted()方法进行排序,也可通过sorted(Comparator)方法自定义比较器来进行排序,前者默认调用equals方法来进行比较。


Stream.of(1, 3, 2).sorted().forEach(System.out::println);

打印结果:1,2,3。

### limit

限制返回前N个元素,与SQL中的limit相似。


Stream.of(1, 2, 3).limit(2).forEach(System.out::println);

打印结果为:1,2。

### collect

收集方法,实现了很多归约操作,比如将流转换成集合和聚合元素等。



Stream.of(1, 2, 3).collect(Collectors.toList());Stream.of(1, 2, 3).collect(Collectors.toSet());

除了以上的集合转换,还有类似joining字符串拼接的方法,具体可查看Collectors中的实现。

### count 

返回Stream中元素个数。


Stream.of(1, 2, 3).count();

### forEach

遍历Stream中所有元素。示例参考以上设计到的。

### forEachOrder

遍历Stream中所有元素,如果Stream设置了顺序,则按照顺序执行(Stream是无序的),默认为元素的插入顺序。

### max

根据指定的比较器(Comparator),返回Stream中最大元素的Optional对象,Optional中的value便是最大值。

Optional可以代表一个值或不存在,主要是为了规避返回值为null,而抛出NullPointerException的问题,也是由Java8引入的。但当调用其get()方法时,如果当前值不存在则会抛出异常。



Optional<Integer> max = Stream.of(1, 2, 3).max(Comparator.comparingInt(o -> o));System.out.println("max:" + max.get());

打印结果:max:3。

### min

与max操作相同,功能相反,取最小值。



Optional<Integer> min = Stream.of(1, 2, 3).min(Comparator.comparingInt(o -> o));System.out.println("min:" + min.get());

打印结果:min:1。

### reduce

reduce可实现根据指定的规则从Stream中生成一个值,比如之前提到的count,max和min方法是因为常用而被纳入标准库中。实际上,这些方法都是reduce的操作。



Stream.of(1, 2, 3).reduce(Integer::sum);Stream.of(1, 2, 3).reduce(0, (a, b) -> a + b);

以上两个方法都是对结果进行求和,不同的是第一个方法调用的是reduce的reduce((T, T) -> T)方法,而第二个调用的是reduce(T, (T, T) -> T)。其中第二个方法的第一个参数0,表示从第0个值开始操作。

### allMatch

判断Stream中的所有元素是否满足指定条件。全部满足返回true,否则返回false。



boolean result = Stream.of(1, 2, 3).allMatch(i  -> i > 0);System.out.println(result);

返回结果:true。

### anyMatch

判断Stream中的元素至少有一个满足指定条件。如果至少有一个满足则返回true,否则返回false。



boolean anyResult = Stream.of(1, 2, 3).anyMatch(i  -> i > 2);System.out.println(anyResult);

返回结果:true。

### findAny

获得其中一个元素(使用stream()时找到的是第一个元素;使用parallelStream()并行时找到的是其中一个元素)。如果Stream为空,则返回一个为空的Optional。



Optional<String> any = Stream.of("A", "B", "C").findAny();System.out.println(any.get());

返回结果:A。

### findFirst

获得第一个元素。如果Stream为空,则返回一个为空的Optional。



Optional<String> first = Stream.of("A", "B", "C").findFirst();System.out.println(first.get());

返回结果:A。

### noneMatch

判断Stream中是否所有元素都不满足指定条件。都不满足则返回true,否则false。



boolean noneMatch = Stream.of(1, 2, 3).noneMatch(i  -> i > 5);System.out.println(noneMatch);

返回结果:true。

### 统计

通过summaryStatistics方法可获得Stream的一些统计信息。






IntSummaryStatistics summaryStatistics = Stream.of(1, 2, 3).mapToInt((i) -> i).summaryStatistics();System.out.println("max:" + summaryStatistics.getMax());System.out.println("min:" + summaryStatistics.getMin());System.out.println("sum:" + summaryStatistics.getSum());System.out.println("average:" + summaryStatistics.getAverage());

这里用到了流与数值流直接的转换mapToInt,类似的方法还有mapToDouble、mapToLong。对应获得的数值流还提供了一些额外的方法,就像上面获取不同统计信息的方法一样。


## 鸟瞰Stream


最后,我们再来看一下Stream的主要接口类关系图。

Java8 Stream新特性详解及实战其中,BaseStream定义了Stream的基本接口,Stream中定义了map、filter、flatMap等常用操作。IntStream、LongStream、DoubleStream是针对基本类型提供了便捷和特化操作。以上接口构建了Java8中流体系的根基。AbstractPipeline是流水线(Pipeline)的核心抽象类,用于构建和管理流水线。

另外,关于Stream的效率问题网上也有很多资料提到,下一篇文章,我们将重点说说Stream的性能问题,关注公众号“程序新视界”,敬请期待。

上一篇:Python数据分析工具


下一篇:【CF gym102759I】Query On A Tree 17