TPC-DS是与真实场景非常接近的一个测试集,它包含7张事实表,17张纬度表,平均每张表含有18列。用这个数据集能够很好的模拟企业数据查询、报表生成以及数据挖掘等复杂应用。
- 安装tpc-ds工具
百度网盘地址:https://pan.baidu.com/s/12berGjbUwMBpnlr1h0TDmw
提取码:afgu
解压后修改hive-testbench-hdp3/tpcds-setup.sh
修改脚本中73行hive的链接串为集群实际的链接串
- 生成数据
hive-testbench-hdp3/tpcds-setup.sh 20生成20G数据
- 语句测试
进入sql所在路径
cd hive-testbench-hdp3/sample-queries-tpcds
使用hive链接串链接到hive
use tpcds_text_2;
source query3.sql;
source query10.sql;
source query15.sql;
source query20.sql;
source query40.sql;
source query74.sql;
source query91.sql;