Hudi VS Doris 使用分析

数据湖是一个集中式的存储库,允许你以任意规模存储多个来源、所有结构化和非结构化数据,可以按照原样存储数据,无需对数据进行结构化处理,并运行不同类型的分析对数据进行加工。

Hudi(Hadoop Upserts Deletes and Incrementals)
定位 -面向数据湖的增量写入、更新与删除技术。Hudi通过表格式管理的能力,为数据湖提供ACID事务、时间旅行查询等特性。
场景 -近实时抽数(大规模数据更新和删除的场景,增量管道,数据分发);近实时分析(实现数据的实时更新和查询)

Doris基于MPP(Massively Parallel Processing)
定位 -实时分析型数据库。性能特点:低延迟数据处理和查询;支持高并发数据查询;实时数据导入和查询。
场景 -实时数据分析;快速响应的交互式查询。

Hudi VS Doris
Doris 主要sql方式使用,无法解决复杂逻辑问题。
hudi,大量并发查询消耗资源大。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值