Superset官方文档中提供了一种SparkSQL的使用方法,然而似乎并不起作用,无意中看到一篇文章提到impyla可以解决这个问题,于是实验了一下,填了诸多坑之后,终于搞定了,把详细过程记录下来,供大家参考,顺便做个备忘~
Superset安装配置
这个网上有太多实例,不再赘述
SparkSQL使用配置
1、安装impyla
pip install impyla
2、在Superset中配置SparkSQL数据源
这时候启动点击测试链接,会报错:‘TSocket’ object has no attribute ‘isOpen’
这是因为thrift-sasl版本不兼容导致的,需要指定安装0.2.1版本
pip install thrift-sasl==0.2.1
这下再测试就OK了,但是SQL Lab中数据库和数据表显示不出来,会报错:ERROR WHILE FETCHING SCHEMA LIST