前言
tableau可视化高级教程链接如下:
https://blog.youkuaiyun.com/wenyusuran/category_9596753.html
需要的小伙伴可根据自身需求,自行订阅。
通过技术可以改进可视化、依据Hadoop群集中存储的数据构建的仪表板的性能。尽管Hadoop是面向批处理的系统,不过目前我们可以通过工作负载调整、Tableau数据引擎的优化提示减少延迟。
提高连接性能
自定义SQL允许使用复杂SQL表达式作为Tableau中连接的基础。通过在自定义SQL中使用LIMIT子句,可以减小数据集以加快浏览新数据集和建立视图的速度。稍后可以移除此LIMIT子句以支持对整个数据集进行实时查询。
可以轻松使用自定义SQL限制数据集大小。如果连接的是单表或多表,就可以将其切换到自定义SQL连接,并让连接对话框自动填充自定义SQL表达式,在自定义SQL的最后一行中添加“LIMIT10000”,以便仅使用前10000条记录。
在处理大量数据时,Tableau数据引擎是功能强大的加速器,支持以低延迟进行临时分析。尽管Tableau数据引擎不是针对Hadoop所具有的相同标度构建的,不过它能够处理多个字段和