不死鸟.亚历山大.狼崽子

不死鸟.亚历山大.狼崽子

1 压缩算法

在HBase可以使用多种压缩编码,包括LZO、SNAPPY、GZIP。只在硬盘压缩,内存中或者网络传输中没有压缩。

  • GZIP的压缩率最高,但是其实CPU密集型的,对CPU的消耗比其他算法要多,压缩和解压速度也慢;
  • LZO的压缩率居中,比GZIP要低一些,但是压缩和解压速度明显要比GZIP快很多,其中解压速度快的更多;
  • Zippy/Snappy的压缩率最低,而压缩和解压速度要稍微比LZO要快一些
  • 本案例采用GZ算法,这样可以确保的压缩比最大化,更加节省空间

2 查看表数据压缩方式

通过以下输出可以看出,HBase创建表默认是没有指定压缩算法的

07-03 16:14