常见存储单元
- 行存储:database(mysql,oracle) hive
- 列存储:hbase、sparkSql
行存储和列存储的比较:
- 是否连续存储:行储存是在磁盘上是连续的;列存储在磁盘不连续
- 写性能比较:写入的此磁盘的次数越少性能是越高的,所以行存储是只写一次性能高,列存储写入多次性能低
- 读性能比较:
- 读整表,是行存储性能较高
- 如果按照指定的列读,则行存储会产生冗余列(海量数据查询性能低),列存储则不会产生冗余列
- 在存储数据的时候,如果是基于行存储的,由于一行的字段类型是不同的,所以会产生频繁的数据类型的转化;
- 如果是基于列存储的,由于同一列的数据类型是一直的,那么可以避免频繁的数据类型的住哪华,也可以考虑压缩算法进行压缩(节省磁盘空间,节省网络带宽)
6325

被折叠的 条评论
为什么被折叠?



