3、长城DF729服务器、kylinV10SP1操作系统,建设的虚拟服务器。配置为:16c32g/200G
下载hive -testbench-hdp3.zip ,根据自己安装的环境下载对应的测试套件 GitHub - hortonworks/hive-testbench
unzip hive -testbench-hdp3.zip
cd hive -testbench-hdp3
./tpcds-build.sh
生成数据和查询sql。(这里指定的rcfile的格式,/data/tpcds-generate此路径是在HDFS上面的路径,而非本地路径)
export FORMAT=rcfile
bash -x tpcds-setup.sh 2 /data/tpcds-generate
FORMAT=rcfile:代表数据文件格式,export FORMAT=rcfile可以不需要;默认生成是orc文件格式
/data/tpcds-generate:代表生成数据的目录
cd hive-testbench
FORMAT=textfile ./tpcds-setup.sh
or
cd hive-testbench
FORMAT=parquet ./tpcds-setup.sh 2