梧桐云原生分析型数据库与Hive数据库数据加载对标测试

Hive与梧桐云原生数据库数据加载对比测试

原创已于 2024-11-26 09:50:48 修改 · 318 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#云原生 #数据库 #hive

于 2024-10-28 21:45:18 首次发布

一、测试目标和背景

某某公司系统部分O域入接口调度任务通过通过 LOAD DATA 的方式加载到 hive 数据仓库的。由于总公司对数据库平台国产化改造的要求，需要将这部分接口任务修改为适配国产梧桐云原生分析型数据库，为确保梧桐云原生分析型数据库能够正常承载这部分接口业务，需要对梧桐数据库和 Hive 进行数据加载能力的对比测试。

二、被测试软件概述

梧桐云原生分析型数据库作为云原生存算分离架构数据库，具备云原生、高性能、强兼容、高并发、纯国产等特性。

三、对标软件介绍

hive 是基于 Hadoop 的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。hive 数据仓库工具能将结构化的数据文件映射为一张数据库表，并提供SQL查询功能。

四、测试环境

梧桐数据库：
WuTongDB:2.0
硬件配置:计算节点C3型服务器，存储节点B2型服务器

Hive数据仓库：
版本：3.1.0
存储节点612个，服务节点4个

五、测试方法

采用同一份数据源分别同时加载 hive 数据仓库和梧桐云原生分析型数据库。
hive 数据仓库通过 LOAD DATA 方式将数据文件移动到与 hive 表对应的位置的纯复制操作入库。
梧桐云原生分析型数据库通过外部表加载数据到正式表的方式入库。

六、测试用例

1、源文件内容和条数

HDFS文本文件包含有日期、数字，汉字，英文字符等，共有3亿条记录。

2、hive加载

Hive 数据仓库通过 LOAD DATA 移动 HDFS 文件到与 hive 表对应的位置进行入库。

3、梧桐云原生分析型数据库

梧桐云原生分析型数据库通过外部表映射 HDFS 文件，然后直接加载到正式表进行入库。

七、测试结果

WuTongDB数据库加载结果显示：
对标测试_oushu.png

HIVE 数据库加载结果显示：
对标测试_hive.jpg

八、性能指标对比

hive数据库和梧桐云原生分析型数据库加载结果显示：
对标测试_hive_oushu.png

九、功能差异分析

hive数据仓库和梧桐云原生分析型数据库都是通过文件加载的方式入库的，功能一致。

十、缺陷和问题

1、梧桐数据加载过程存在无法实时监控数据加载进度。

十一、用户体验评价

梧桐云原生分析型数据库数据加载能力基本满足业务要求。

十二、结论和建议

通过 hive 数据仓库和梧桐云原生分析型数据库加载性能指标对比可以得出以下结论：
在相同的环境前提下，超大规模数据加载业务场景下，梧桐云原生分析型数据库加载和 hive 数据仓库加载运行效率差不多。

十三、附录

无

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。