正如我们在Java Streams:流创建中所学到的,流管道由源、零个或多个中间操作和一个终端操作组成。
我们还了解到,streams流是懒惰的;仅当终端操作启动时,才对源数据执行计算。
在本文中,我们将进一步探讨streams流操作。
streams流操作
流操作可以是中间操作,也可以是终端操作。中间操作产生另一个流。同样,终端操作也会产生结果或副作用。
让我们看看Java流提供的一些操作。
过滤流
您可以通过将 predicate (T -> boolean) 传递给 filter 方法来过滤流。过滤器是返回过滤流的中间操作。如果您熟悉 SQL ,可以将谓词视为 where 子句。
List<Book> javaBooks =
books.stream()
.filter(book -> book.getCategory().equals(JAVA))
.collect(Collectors.toList());
这里根据类别过滤图书流。 谓词 函数是一个lambda函数 book->book.getCategory().equals(JAVA) 。
时断时续
假设你需要找到所有价格低于42美元的书。您可以执行以下操作:
List<Book> lessThan =
books.stream()
.filter(book -> book.getPrice() <)
.collect(Collectors.toList());
上述方法的一个问题是,即使对书籍进行了排序,过滤器也会遍历整个列表。我们可以使用 takeWhile as 将流短路:
List<Book> priceLessThan =
books.stream()
.takeWhile(book -> book.getPrice() <)
.collect(Collectors.toList());
takeWhile 是在Java9中引入的。
类似地,您可以使用 dropWhile 删除流中与给定条件匹配的元素。此操作是 takeWhile 的补充。
List<Book> priceGreaterThan =
books.stream()
.dropWhile(book -> book.getPrice() <)
.collect(Collectors.toList());
如果流无序,并且该流的某些(但不是全部)元素与给定谓词匹配,则 takeWhile / dropWhile 操作的行为是不确定的。在这种情况下,它可以返回匹配元素的任何子集,包括空流。
查找流的不同元素
distinct() 方法通过应用 equals() 方法返回由 distinct 元素组成的流。这是一个有状态的中间操作。
List<String> publisher =
books.stream()
.map(book -> book.getPublisher())
.distinct()
.collect(Collectors.toList());
有状态操作的问题
如果传递给流操作的函数是有状态的,则流管道结果可能是不确定的或不正确的。有状态操作的结果取决于流管道执行期间可能更改的任何状态。
有状态lambda的一个示例是 map() 的参数:
Set<Integer> seen = Collections
. synchronized Set(new HashSet<>());
stream.parallel()
.map(e -> { if (seen.add(e)) return; else return e; })...
这里,如果并行执行映射操作,由于线程调度的差异,相同输入的结果可能会因运行而异。然而,对于无状态lambda表达式,结果总是相同的。
截流
您可以通过对流使用限制操作使流短路来截断流。限制是一个有状态的操作。这是一个非常便宜的顺序流操作。但是,在有序并行流上可能非常昂贵。
books.stream().limit() .collect(Collectors.toList());
可以使用 skip(n) 操作放弃流的前n个元素。与 limit 类似,在有序并行管道上,这可能是一个非常昂贵的操作。
books.stream().skip() .collect(Collectors.toList());
映射流
可以使用映射函数将一个流映射到另一个流。
map
我们可以应用 map 函数将一个流转换为另一个流。例如,将 Stream<Book> 映射到作者的 Stream<String> 可以作为 books.Stream().map(Book::getAuthor) 完成。 map 操作的结果是在流的每个元素上应用函数 function (T) -> R 之后的另一个流。
static List<String> mapToAuthors(List<Book> books) {
return books.stream()
.map(Book::getAuthor)
.collect(Collectors.toList());
}
传递给映射操作的函数应该是无干扰和无状态的;否则,可能会出现不希望出现的行为,并有可能在将来破坏代码。
FlatMap
flatMap 操作将一对多转换应用于流的元素,并将结果元素展平为新的流。
<R> Stream<R> flatMap(Function<? super T
, ? extends Stream<? extends R>> mapper);
与 map 一样,传递给 flatMap 操作的 mapper 函数应该是无干扰和无状态的。
Set<String> s =
Stream.of(set, set2)
.flatMap(Set::stream)
.collect(Collectors.toSet());
map 和 flatMap 操作之间的区别是–map仅应用变换。然而, flatMap 也会使流变平。
static void flatMap() {
List<Integer> primeNumbers =
Arrays.asList(, 3, 5, 7, 11, 13);
List<Integer> evenNumbers =
Arrays.asList(, 4, 6, 8);
List<List< Integer >> evenOrPrime =
Arrays.asList(primeNumbers, evenNumbers);
List<Integer> numbers =
evenOrPrime.stream()
.flatMap(Collection::stream)
.collect(Collectors.toList());
log.info("Flattened map : {}", numbers);
}
上面的示例打印–展平地图:[2,3,5,7,11,13,2,4,6,8]。如您所见,flatMap将List<Integer>流展平为Integer流。
映射到原始流
通过分别调用方法mapToInt、mapToDouble和mapToLong,可以将流<T>映射到专用的基本流IntStream、DoubleStream和LongStream。
static DoubleStream mapToPrice(List<Book> books) {
return books.stream()
.mapToDouble(Book::getPrice);
}
通过调用boxed as,可以将专用基本流转换回非专用流:
static Stream<Double> box(DoubleStream doubleStream) {
return doubleStream.boxed();
}
流的匹配元素
Stream类提供了在流中查找匹配元素的方法。有两种方法。返回布尔值,例如anyMatch。另一个返回可选的,例如findAny。
Any Match
如果找到给定谓词的任何匹配项, anyMatch 方法将返回true。这是一种短路终端操作。对于空流,此操作返回false,并且不计算流。
static boolean hasAnyJavaBook(List<Book> books) {
return books.stream()
.anyMatch(book -> book.getCategory().equals(JAVA));
}
All Match
当流的元素与给定谓词匹配时, allMatch 方法返回true。这是一种短路终端操作。对于空流,此操作返回true,并且不计算流。
static boolean hasAllJavaBook(List<Book> books) {
return books.stream()
.allMatch(book -> book.getCategory().equals(JAVA));
}
None Match
如果流中没有与给定谓词匹配的元素,则 noneMatch 方法返回true。这是一种短路终端操作。对于空流,此操作返回true,并且不计算流。
static boolean hasNoJavaBook(List<Book> books) {
return books.stream()
.noneMatch(book -> book.getCategory().equals(JAVA));
}
查找流的元素
Find Any
findAny 方法返回描述流的任意元素的可选值,如果流为空,则返回空可选值。这是一种短路终端操作。此操作的行为是不确定的;它可以返回流的任何元素。
在并行流的情况下,不确定性行为允许实现最佳性能。
static Optional<Book> findAnyJavaBook(List<Book> books) {
return books.stream()
.filter(book -> book.getCategory().equals(JAVA))
.findAny();
}
Optional<T>类(java.util.Optional)是一个容器对象,用于表示值T的存在或不存在。如果findAny没有找到任何元素,那么它将返回空的Optional而不是null。
Find First
findFirst 方法返回表示流的第一个元素的可选值,如果流为空,则返回空可选值。如果流没有遇到顺序,则可以返回任何元素。
static Optional<Book> findFirstJavaBook(List<Book> books) {
return books.stream()
.filter(book -> book.getCategory().equals(Category.JAVA))
.findFirst();
}
在并行流中查找第一个元素是昂贵的。如果您不关心返回哪个元素,我们应该使用findAny。
还原操作
还原操作(也称为折叠)通过重复应用组合操作,获取一系列输入元素并将它们组合成单个结果。流类有一些通用的缩减操作,如reduce()和collect(),还有一些专门的缩减操作,如min()、max()等。
Reduce
reduce方法T reduce(T identity, Binary Operator<T>累加器)使用基于初始标识值的关联累加器函数(BinaryOperator:T,U->R)对流执行reduce操作。这是一个终端操作。
static double sum() {
List<Integer> numbers =
List.of(, 2, 3, 4, 5);
return numbers.stream()
.reduce(, (a, b) -> a + b);
}
或者使用方法引用:
private static double sum() {
List<Integer> numbers =
List.of(, 2, 3, 4, 5);
return numbers.stream()
.reduce(, Integer::sum);
}
如果流为空,则返回标识(初始)值。reduce方法的另一个变体是’Optional<T>reduce(BinaryOperator<T>累加器)’返回Optional<T>(对于空流)。
Min和Max
“减少”操作可用于查找最小值和最大值,如下所示:
List<Integer> numbers =
List.of(,2,3,4,5);
Optional<Integer> min =
numbers.stream().reduce(Integer::min);
Optional<Integer> max =
numbers.stream().reduce(Integer::max);
总结
流操作可以是中间操作,也可以是终端操作。中间操作产生另一个流。同样,终端操作也会产生结果或副作用。
- 您可以使用 filter 、 distinct 、 takeWhile 、 dropWhile 、 skip 和 limit 方法对流进行过滤和切片。
- 可以使用“ map ”和“ flatMap ”方法变换流的元素。 flatMap 操作也会使流变平。
- 您可以使用 findFirst 和 findAny 方法在流中查找元素。
- 可以通过对给定谓词使用 allMatch 、 anyMatch 和 anyMatch 方法来匹配流。
- 您可以使用 reduce 组合流的元素。