Cloudera新的开源储存引擎 Kudu

外媒报道,大数据公司 Cloudera 正在开发一个大型的开源储存引擎 Kudu,用于储存和服务大量不同类型的非结构化数据。预计本月底发布。

Kudu 将被当作目前广泛使用的 Hadoop Distributed File System 和 Hadoop-oriented HBase NoSQL 数据库的替代产品,并将集合两者的特点。Kudu 将遵循 Apache 协议开源。

据说,Kudu 的扫描速度几乎和原生 HDFS 一样快,同时随机访问速度和 HBase 几乎一样快。不过,Kudu 并不打算替换掉 HDFS 或 HBase。Cloudera 未来也会继续支持 HDFS 和 HBase 。

Kudu 可用于时间序列数据,实时报告,模型构建。但它不是一个 SQL 查询引擎用来 pull 特定数据。Kudu 将集成 Impala,未来也将支持 Spark。此外,Kudu 的 API 可以使用 Java 和 C++。

Kudu相比较hbase而言可以进行改操作,就是可以将录入的数据进行改变,这样进一步加大了hadoop处理大数据的能力和范围,增加了应用的领域,主要面向反欺诈,风险评估等多种应用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值