
kudu
文章平均质量分 80
空中的鱼1987
这个作者很懒,什么都没留下…
展开
-
Kudu Consensus Design
kudu一致性设计根据自己对kudu的理解,翻译了部分kudu的设计文档,仅供自己加深理解,如果有翻译不对的地方或者理解有误的地方,欢迎指正。walwal提供严格的顺序写和持续性保证1.写入数据如果是外部同步的,提交请求的顺序会与最终写入到磁盘的顺序一致 2.如果设置了log_force_fsync_all=enabled(默认disabled),每个写入请求保证数据写入磁盘后才返回成功。 为了原创 2016-05-04 18:30:59 · 1521 阅读 · 1 评论 -
kudu1.2.0版本信息
新特性kudu clients和servers可以编辑用户的数据,例如log信息,java的异常信息和状态信息。但用户的元数据是不可编辑的,例如表名,字段名,分区边界。默认是可编辑的,但可以通过设置log_redact_user_data=false关闭。kudu一致性保证的能力大幅度提升了: 每个副本都会track它们的 safe timestamp,这个时间戳是最大时间戳,在这个时间戳上读原创 2017-03-06 18:20:27 · 1057 阅读 · 0 评论 -
kudu1.1.0版本信息
新特性python API升级,具备JAVA C++client一样的功能(从0.3版本直接升级到1.1),主要的点如下: 1.1. 改进了Parial Row的语义 1.2. 增加了range partition支持 1.3. 提供了 scan api 1.4. 增强predicate支持 1.5. 支持所有kudu的类型,包括datetime.datetime转化成UNIXTIME_原创 2017-03-06 15:07:07 · 1426 阅读 · 0 评论 -
kudu scan java api
kudu 0.8.0版本支持scan来查询一个区域内的数据,目前不支持get api,可关注issueKUDU-1235,小米冰琳兄在做。原创 2016-05-18 18:02:55 · 5883 阅读 · 1 评论 -
kudu master design
kudu master design kudu的主节点设计文档原创 2016-05-09 18:48:36 · 3093 阅读 · 0 评论 -
kudu tablet design
Tablet是kudu表的水平分区,类似于google Bigtable的tablet,或者HBase的region。每个tablet存储着一定连续range的数据(key),且tablet两两间的range不会重叠。一张表的所有tablet包含了这张表的所有key空间。Tablet由RowSet组成,RowSet由一组rows组成(n条数据、n行数据)。RowSet是不相交的,即不同的RowSet原创 2016-05-15 14:19:20 · 8010 阅读 · 2 评论 -
kudu compaction design
design notes这篇文章解释了RowSet的flush、compaction执行过程。目标:执行update的同时,把两个key range有重叠的RowSet,合并成一个RowSet。原创 2016-05-17 18:04:39 · 1528 阅读 · 0 评论 -
kudu编译及自定义版本升级
目的由于kudu目前属于孵化版本,跟踪slack有一些很值得去提升性能的patch,希望可以自定义编译kudu工程,然后发布到集群环境中(kudu集群是通过cloudera manager parcels安装的)。原创 2016-05-05 17:18:19 · 2889 阅读 · 2 评论 -
Kudu总结
介绍Kudu集HDFS的顺序读和HBASE的随机读于一身,同时具备高性能的随机写,以及很强大的可用性(单行事务,一致性协议),支持Impala spark计算引擎。原创 2017-04-27 15:48:00 · 8874 阅读 · 0 评论