四、Hadoop的压缩
优点:减少磁盘IO,减少磁盘存储空间
缺点:增加CPU开销
压缩原则:
运算密集型Job,少用压缩
IO密集型的Job,多用压缩
MR支持的压缩编码
压缩方式的选择:
压缩方式选择时重点考虑:压缩/解压缩速度、压缩率(压缩后存储大小)、压缩后是否可以支持切片
四、Hadoop的压缩
优点:减少磁盘IO,减少磁盘存储空间
缺点:增加CPU开销
压缩原则:
运算密集型Job,少用压缩
IO密集型的Job,多用压缩
MR支持的压缩编码
压缩方式的选择:
压缩方式选择时重点考虑:压缩/解压缩速度、压缩率(压缩后存储大小)、压缩后是否可以支持切片