[아이템 48] 스트림 병렬화는 주의해서 적용하라

[배경]

동시성 프로그래밍 측면에서 자바는 항상 앞서갔다.

1996년, 첫 릴리스부터 스레드, 동기화, wait/notify를 지원했다.
자바 5부터는 동시성 컬렉션인 java.util.concurrent 라이브러리와 실행자(Executor) 프레임워크를 지원했다.
자바 7부터는 고성능 병렬 분해(parallel decom-position) 프레임워크인 포크-조인(fork-join) 패키지를 추가했다.
자바 8부터는 parallel 메서드만 한 번 호출하면 파이프라인을 병렬 실행할 수 있는 스트림을 지원했다.

[Why]

동시성 프로그래밍을 할 때는 안전성(safety)과 응답 가능(liveness) 상태를 유지하기 위해 애써야 하는데, 병렬 스트림 파이프라인 프로그래밍에서도 다를 바 없다.

public static void main(String[] args) {
    primes().map(p -> TWO.pow(p.intValueExact()).subtract(ONE))
        .filter(mersenne -> mersenne.isProbablePrime(50))
        .limit(20)
        .forEach(System.out::println);
}

static Stream<BigInteger> primes() {
    return Stream.iterate(TWO, BigInteger::nextProbablePrime);
}

처음 20개의 메르센 소수(Mersenne prime)를 출력하는 프로그램이다.
메르센 수는 2^p - 1 형태의 수다. 여기서 p가 소수이면 해당 메르센 수도 소수일 수 있는데, 이때의 수를 메르센 소수라 한다.
(저자 기준) 위 프로그램은 12.5초 만에 20개의 소수를 찍어낸다.
단순히 속도를 높이고 싶어 스트림 파이프라인의 parallel()을 호출하면 어떻게 될까?
아무것도 출력하지 못하면서 CPU는 90%나 잡아먹는 상태가 무한히 계속된다. (응답 불가: liveness failure)

스트림 라이브러리가 이 파이프라인을 병렬화하는 방법을 찾아내지 못했기 때문이다.

데이터 소스가 Stream.iterate거나 중간 연산으로 limit를 쓰면 파이프라인 병렬화로는 성능 개선을 기대할 수 없다.
심지어, 파이프라인 병렬화는 limit를 다룰 때 CPU 코어가 남는다면 원소를 몇 개 더 처리한 후 제한된 개수 이후의 결과를 버려도 아무런 해가 없다고 가정한다.
그런데 이 코드의 경우 새롭게 메르센 소수를 찾을 때마다 그 전 소수를 찾을 때보다 두 배 정도 더 오래 걸린다.
원소 하나를 계산하는 비용이 대략 그 이전까지의 원소 전부를 계산한 비용을 합친 것만큼 든다는 뜻이다.
스트림 파이프라인을 마구잡이로 병렬화했다간, 성능이 오히려 끔찍하게 나빠질 수도 있다.

스트림을 잘못 병렬화하면 (응답 불가를 포함해) 성능이 나빠질 뿐만 아니라 결과 자체가 잘못되거나 예상 못한 동작이 발생할 수 있다.

결과가 잘못되거나 오동작하는 것은 안전 실패(safety failure)라 한다.
안전 실패는 병렬화한 파이프라인이 사용하는 mappers, filters 혹은 프로그래머가 제공한 다른 함수 객체가 명세대로 동작하지 않을 때 벌어질 수 있다.

[When]

스트림의 소스가 ArrayList, HashMap, HashSet, ConcurrentHashMap의 인스턴스거나 배열, int 범위, long 범위일 때 병렬화의 효과가 가장 좋다.

이 자료구조들은 모두 데이터를 원하는 크기로 정확하고 손쉽게 나눌 수 있어서 일을 다수의 스레드에 분배하기에 좋다는 특징이 있다.
- 나누는 작업은 Spliterator가 담당하며, Spliterator 객체는 Stream이나 Iterable의 spliterator 메서드로 얻어올 수 있다.
또한 이 자료구조들은 원소들을 순차적으로 실행할 때의 참조 지역성(locality of reference)이 뛰어나다.
- 이웃한 원소의 참조들이 메모리에 연속해서 저장되어 있다는 뜻이다.
- 참조 지역성이 낮으면 스레는 데이터가 주 메모리에서 캐시 메모리로 전송되어 오기를 기다리며 대부분 시간을 멍하게 보낸다.
- 참조 지역성은 다량의 데이터를 처리하는 벌크 연산을 병렬화할 때 아주 중요한 요소로 작용한다.
- 참조 지역성이 가장 뛰어난 자료구조는 기본 타입의 배열이다.

스트림 파이프라인의 종단 연산의 동작 방식 역시 병렬 수행 효율에 영향을 준다.

종단 연산에서 수행하는 작업량이 파이프라인 전체 작업에서 상당 비중을 차지하면서 순차적인 연산이라면 파이프라인 병렬 수행의 효과는 제한될 수 밖에 없다.
종단 연산 중 병렬화에 가장 적합한 것은 축소(reduction)다.
- 축소는 파이프라인에서 만들어진 모든 원소를 하나로 합치는 작업으로, Stream의 reduce 메서드 중 하나, 혹은 min, max, count, sum 같이 완성된 형태로 제공되는 메서드 중 하나를 선택해 수행한다.
- anyMatch, allMatch, noneMatch처럼 조건에 맞으면 바로 반환되는 메서드도 병렬화에 적합하다.
가변 축소(mutable reduction)를 수행하는 Stream의 collect 메서드는 병렬화에 적합하지 않다.
- 컬렉션들을 합치는 부담이 크기 때문이다.

실제로 성능이 향상될지를 추정해보는 간단한 방법이 있다.

스트림 안의 원소 수와 원소당 수행되는 코드 줄 수를 곱해보자.
이 값이 최소 수십만은 되어야 성능 향상을 맛볼 수 있다.

[How]

Stream 명세는 이때 사용되는 함수 객체에 관한 엄중한 규약을 정의해놨다.

예컨대 Stream의 reduce 연산에 건네지는 accumulator(누적기)와 combiner(결합기) 함수는 반드시 결합법칙을 만족하고(associative), 간섭받지 않고(non-interfering), 상태를 갖지 않아야(stateless) 한다.

조건이 잘 갖춰지면 parallel 메서드 호출 하나로 거의 프로세서 코어 수에 비례하는 성능 향상을 만끽할 수 있다.

static long pi(long n) {
    return LongStream.rangeClosed(2, n)
        .mapToObj(BigInteger::valueOf)
        .filter(i -> i.isProbablePrime(50))
        .count();
}

위 코드는 π(n), 즉 n보다 작거나 같은 소수의 개수를 계산하는 함수다.

static long pi(long n) {
    return LongStream.rangeClosed(2, n)
        .parallel()
        .mapToObj(BigInteger::valueOf)
        .filter(i -> i.isProbablePrime(50))
        .count();
}

(저자 기준, 쿼드 코어) 위의 코드로 π(10^8)을 계산하는 31초, 아래 코드로 9.2초가 걸렸다.

무작위 수들로 이뤄진 스트림을 병렬화하려거든 ThreadLocalRandom(혹은 구식인 Random)보다는 SplittableRandom 인스턴스를 이용하자.

SplittableRandom은 정확히 이럴 때 쓰고자 설계된 것이라 병렬화하면 성능이 선형으로 증가한다.
ThreadLocalRandom은 단일 스레드에서 쓰고자 만들어졌다.
Random은 모든 연산을 동기화하기 때문에 병렬 처리하면 성능이 최악일 것이다.

'독서찰기(讀書札記) > 이펙티브 자바' 카테고리의 다른 글

[아이템 50] 적시에 방어적 복사본을 만들라 (0)	2022.03.11
[아이템 49] 매개변수가 유효한지 검사하라 (0)	2022.03.11
[아이템 47] 반환 타입으로는 스트림보다 컬렉션이 낫다 (0)	2022.03.09
[아이템 46] 스트림에서는 부작용 없는 함수를 사용하라 (0)	2022.03.05
[아이템 45] 스트림은 주의해서 사용하라 (0)	2022.03.05

영화로운날

[아이템 48] 스트림 병렬화는 주의해서 적용하라

[배경]

[Why]

[When]

[How]

'독서찰기(讀書札記) > 이펙티브 자바' 카테고리의 다른 글

티스토리툴바

[아이템 48] 스트림 병렬화는 주의해서 적용하라

[배경]

[Why]

[When]

[How]

'독서찰기(讀書札記) > 이펙티브 자바' 카테고리의 다른 글

'독서찰기(讀書札記)/이펙티브 자바' Related Articles

티스토리툴바