trino tpcds测试

原创已于 2025-11-19 09:32:44 修改 · 662 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#trino #tpcds #presto

于 2023-10-18 10:03:02 首次发布

Presto 专栏收录该内容

5 篇文章

订阅专栏

本文介绍了如何在Linux和macOS环境下使用tpcds-kit生成TPC-DS数据和SQL查询，通过hive-testbench创建表并导入数据。作者提供了test.sh和trino-tpcds.sh脚本执行99条SQL，使用nohup进行异步运行，并分析查询时间。

先下载tpcds-kit（有Linux和macOS），根据其文档生成数据和查询的sql。
进入tools目录，创建下面的脚本gendata.sh，在tools上级目录下先创建data目录，然后生成1TB

#!/bin/bash

for i in {1..10}; do
   ./dsdgen -scale 1000 -dir ../data  -parallel 10 -child $i &
done

然后hive-testbench，在ddl-tpcds/text/alltables.sql中有建表语句（用hive建表）。

建完表后LOAD DATA local INPATH "/Users/ding/tools/tpcds-kit/data/web_site.dat" OVERWRITE INTO TABLE tpcds.web_site;导入数据到对应表里。

写test.sh和trino-tpcds.sh两个脚本跑99条sql（q72可能失败，可将其删除）
test.sh如下

#!/bin/bash
for sql in `find tpcds-queries -type f`
do 
	sh trino-tpcds.sh ${sql}
done

trino-tpcds.sh如下

#!/bin/bash
echo $1:
java -jar trino-cli-406-executable.jar --server IP_ADDRESS:8080  --catalog hive --schema tpcds  -f $1 --progress
echo "$1 end"

执行命令nohup sh test.sh &

nohup会将命令的输出结果重定向到nohup.out中，然后vim nohup.out，通过搜索tpcds-queries关键字查看每条sql的运行时间

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

csding11

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Trino(Presto345) on Hive知识总结及TPC-DS测试

TT-Learning

12-31

8750

文章目录1.PrestoSQL更名Trino2.PrestoSQL-345 与 Hive-3.1.0 的操作2.1 Presto连接Hive配置2.2 基础配置介绍2.2.1 在 Ambari 集群中操作 Hive 组件2.2.2 在 Presto 集群客户端操作2.2.3 Presto支持Hive的分区表操作2.3 优化，提高查询性能2.4 分区操作2.5 特殊列2.6 特殊表2.7 操作示例 Examples2.7.1 create schema（schema相当于MySQL中的数据库名称）2.7.2

TPC-DS测试Oracle操作步骤记录

美丽的毛毛草

11-04

1000

1. 下载TPC-DS压缩包并存放到指定位置 TPC-DS_Tools_v2.10.1.zip 链接：https://pan.baidu.com/s/1IDqZN75U-j9j27ETVTQCMA 提取码：0z6m 2. 构建编译环境 Ubuntu: sudo apt-get install gcc make flex bison byacc git CentOS/RHEL: sudo yum install gcc make flex bison byacc git // 解压压缩包并进入./v2.1

参与评论您还未登录，请先登录后发表或查看评论

适用于 AWS Redshift 的 TPC-DS 基准测试

hezhiming1995的博客

08-25

1500

适用于 AWS Redshift 的 TPC-DS 基准测试1. 组件环境1.1 什么是TPC-DS？1.2 TPC-DS的特性1.3 TPC-DS 基准测试维度1.4 TPC-DS 测试表数据详情2. 测试流程2.1 申请TPC官方Benchmark工具包及文档2.2 安装TPC-DS工具包（base on Linux）2.3 修改建表语句，使其符合 AWS Redshift 标准的DDL2.4 构建测试数据集2.5 加载数据到Redshift中2.6 生成Redshift标准查询流3. 修改为Red.

使用Benchto框架对Trino进行SQL性能对比测试

书忆江南的IT博客

02-15

4079

有时需要对魔改源码前后的不同版本Trino引擎进行性能对比测试，提前发现改造前后是否有性能变差或变好的现象，避免影响数据业务的日常查询任务性能。而Trino社区正好提供了一个性能测试对比框架：因此使用它可以较大程度上减少一通魔改后，看起来代码量很大且功能很牛，但是实际上线性能拉垮，改了个寂寞的现象。

TPC-DS性能测试及使用方法

u011250186的博客

10-26

3667

一、安装TPC-DS工具 1、下载工具下载地址：http://www.tpc.org/tpc_documents_current_versions/download_programs/tools-download-request.asp?bm_type=TPC-DS&bm_vers=2.6.0&mode=CURRENT-ONLY 注意：必须输入邮箱，他会发下载地址到邮箱中，点击下载地址即可下载。 2、解压编译工具 1）解压执行命令：unzip 944eb36c-5...

Trino源码Gitlab CICD单测环境搭建

书忆江南的IT博客

11-21

3927

在中大型公司，由于对Trino源码的定制魔改量越来越大，会随着时间推移而增大出现冷门bug的概率，所以建立一套自动测试机制，在魔改源码合入主分支时可以自动触发test case，通过特定单测的执行失败，来更清晰的判断是否过去的魔改涉及到了不符合社区源码原本假设的部分，并对魔改后的情况不一致进行修正。Gitlab Runner正好可以提供这样的机制，提升更早发现源码改动问题的效率。

Presto/Trino连接器原理、添加各种Connector(TPC-H、TPC-DS、JMX、黑洞Blackhole、Memory内存)

Bulut0907

03-12

3343

1. Connectors连接器的原理如果一个数据源的数据格式，可以用Presto/Trino的数据类型表示成表的行和列，就可以实现Presto/Trino提供的服务提供者接口(service provider interface, SPI)，抽象成Presto/Trino的表，就可以使用Presto/Trino的SQL查询各种数据源 SPI主要包含3部分的功能：在数据源和Presto/Trino数据处理引擎进行之间数据格式转换，以便读取和写入获取schema、table、视图的元数据进行逻辑单位

trino&OLKtpcds100G2.pptx

03-13

【描述】: "本PPT详尽地展示了Trino与OLK1.1在执行TPCDS-99 SQL集上的性能测试结果，通过一系列的查询对比，揭示了两个系统的性能差异和优势。" 【标签】: "pp" (可能代表PPT或性能测试) 【主要内容】: 这个文件...

Tardigrade：Trino 解决 ETL 场景的方案

过往记忆大数据

06-26

1016

Presto 在 Facebook 的诞生最开始是为了填补当时 Facebook 内部实时查询和 ETL 处理之间的空白。Presto 的核心目标就是提供交互式查询，也就是我们常说的 Ad-Hoc Query，很多公司都使用它作为 OLAP 计算引擎。但是随着近年来业务场景越来越复杂，除了交互式查询场景，很多公司也需要批处理；但是 Presto 作为一个 MPP 计算引擎...

tpcds数据压测

义笔记

06-28

8346

1.tpcds数据压测(支持关系数据库) TPC资源准备这个部分主要介绍如何从TPC上获得测试所需资源，入1GB数据、500GB数据的生成，建表语句和sql语句的生成等等。 1.官网下载tpc-ds压缩包参考 git clone https://github.com/gregrahn/tpcds-kit.git 2.在tools文件中执行make [root@node1tpc]# cd /tpcds-kit/tools [root@node1 tools]# make 注意：若没有安装gcc会报错！ 3

从头开始系列(二)--数据基准测试篇之TPC-DS

weixin_42028303的博客

04-24

4635

从头开始系列—数据基准测试篇之TPC-DS标签（空格分隔）：大数据从头开始系列1、准备工具TPC-DS不多做介绍了，根据官方提供得文档我们可以看到：可以做Ad hocOLAP查询等等，那么在大数据领域，我们可以使用TPC-DS来生成海量数据，并且使用它提供得测试语句来完成性能得基准测试。再官方网站下载相关软件包：http://www.tpc.org/tpc_documents_current_...

如何进行TPS-DS测试

huangmr的专栏

01-14

8444

1 简介随着开源Hapdoop、Map/Reduce、Spark、HDFS、HBASE等技术的商用化，大数据管理技术得到了突飞猛进的发展。如何客观地比较不同数据管理系统，即大数据测试基准的选择，成为一个重要的研究课题。事务性能管理委员会(TransactionProcessing Performance Council,TPC)，是目前最知名的非赢利的数据管理系统评测基准标准化组织

编译 TPC-DS ( dsdgen / dsqgen ) 生成测试数据和查询语句

Laurence的技术博客

08-01

2931

TPC所有Benchmark工具包的下载地址是https://www.tpc.org/tpc_documents_current_versions/current_specifications5.asp , TPC-DS当前最新版本是3.2.0，下载前需要填写真实的邮箱地址，因为下载连接是通过邮件发送的。将下载好的安装包上传到Linux服务器，并解压安装包

如何编译及使用TPC-DS生成测试数据

u011250186的博客

10-26

1947

温馨提示：要看高清无码套图，请使用手机打开并单击图片放大查看。 Fayson的github：https://github.com/fayson/cdhproject 提示：代码块部分可以左右滑动查看噢 1.文档编写目的 TPC-DS采用星型、雪花型等多维数据模式。它包含7张事实表，17张纬度表平均每张表含有18列。其工作负载包含99个SQL查询，覆盖SQL99和2003的核心部分以及OLAP。这个测试集包含对大数据集的统计、报表生成、联机查询、数据挖掘等复杂应用，测试用的数据和值是有倾斜的，与...

Tpc-ds测试以及结果

chenlouzhen1603的博客

12-22

2370

1.1背景介绍 TPC-DS是衡量决策支持解决方案的性能，包括事实上的行业标准，但不限于，大数据系统。目前版本为V2。它模型的几个一般适用的方面的决策支持系统，包括查询和数据维护。虽然TPC-DS基本的商业模式是零售产品供应商、数据库架构、数据查询、数据维护人口模型和实施规则被设...

通过编译TPC-DS生成测试数据并发送到benchmark进行查询测试

m0_67550015的博客

07-26

1496

下载地址（http//www.tpc.org/tpc_documents_current_versions/current_specifications.asp)在tools⽬录是通过dsdgen命令⽣成指定量级的测试数据，可以通过并⾏的⽅式⽣成数据，可以指定数据的分隔符等，具体参数可以使⽤dsdgen–h来查看。将queries⽂件夹放⼊cd/usr/local/src/v2.11.0rc2/下，执⾏压测脚本进⾏压测即可。（2）将下载的文件放到/usr/local/src目录底下。...

使用TPC-DS对kudu进行基准测试

sinat_37316828的博客

06-16

2168

使用TPC-DS对kudu进行基准测试使用TPC-DS对kudu进行基准测试目录文章目录使用TPC-DS对kudu进行基准测试TPC-DS介绍kudu介绍安装TPC-DS工具初始化目录，提前准备sh脚本，使用TPC-DS工具生成测试数据和基准查询语句TPC—DS生成测试数据文件批量上传至HDFSTPC-DS提供DDL语句与impala和kudu建表语法有差异，需要手动改造impala外部表和kudu表的创建-外部表数据导入到kudu表中数据导入成功进行TPC—DS提供的基准查询使用TPC-DS工具对

TPC-DS 性能测试

qq_15138049的博客

08-22

4013

TPC-DS

【Trino实战】Trino调研说明

有问题的请私信或关注v【技术印记】留言

06-24

4012

Trino是一个分布式SQL查询引擎，旨在查询分布在一个或多个异质数据源的大型数据集。

Trino