MapReduce 튜닝하기

기존 MapReduce

아키텍쳐 : INPUT → Mapper → Shuffle&Sort → Reducers → OUTPUT

INPUT → Mapper → Combiner → Partitioner → Shuffle&Sort → Reducer → OUTPUT

DISK IO 압축mapreduce.map.output.compress=true 적용하기CPU수치만으로보면 오버헤드가 큰것같지만, Shuffle단계에서 수치를 확 줄일수 있다는것이 장점
LZO, BZIP, Snazzy 같은 압축기술을 써서 중간데이터 크기를 줄여버리기
Map output을 줄이는 방법

WordCount예제로 보는 Map & Reduce (1)	2022.11.01
Secondarynamenode(SNN), fsimage, HDFS Balancer (0)	2022.11.01
Datanode가 죽었을때, Masternode가 죽었을때 (0)	2022.11.01
하둡에서 블록 용량 디폴트가 128MB인 이유 (0)	2022.11.01

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`