数仓可视化5--superset的部署安装

本文详细介绍了ApacheSuperset的数据探索和可视化平台的安装过程,包括安装Miniconda3、配置环境变量、创建Python环境、安装依赖、初始化数据库、数据库连接设置以及MySQL驱动的安装。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、superset简介

Apache Superset 是一个现代的数据探索和可视化平台。它功能强大且十分易用,可对接各种数据源,包括很多现代的大数据分析引擎,拥有丰富的图表展示形式,并且支持自定义仪表盘。

2、安装步骤

2.1、安装Miniconda3

 anaconda 是一个集成环境,不仅有Python,还有python需要的各种类库。

bash Miniconda3-latest-Linux-x86_64.sh

因为需要阅读协议,所以比较长按q键退出阅读。 最后同意协议 yes,并指定安装位置/usr/local/miniconda3

2.2、配置miniconda3的环境变量

export CONDA_HOME=/usr/local/miniconda3
export PATH=$PATH:$CONDA_HOME/bin

刷新环境变量

source /etc/profile

2.3、取消激活base环境

conda config --set auto_activate_base false

2.4、配置Python环境 使用的python3.6的版本

conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
conda config --set show_channel_urls yes

创建superset的环境:

conda create -n superset python=3.6

遇到 y| n 选择 y

2.5、进入superset的环境中安装依赖插件

source activate

conda activate superset

yum install -y python-setuptools

yum install -y gcc gcc-c++ libffi-devel python-devel python-pip python-wheel openssl-devel 

pip install --upgrade setuptools pip -i https://mirrors.aliyun.com/pypi/simple/

pip install apache-superset -i https://mirrors.aliyun.com/pypi/simple/

pip install dataclasses -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host

pip install gunicorn -i http://mirrors.aliyun.com/pypi/simple/ mirrors.aliyun.com

pip install tushare --upgrade -i https://mirrors.aliyun.com/pypi/simple/

pip --default-timeout=100 install -U tushare --upgrade 

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple/

pip install sqlalchemy==1.3.24

pip uninstall cryptography
pip install cryptography==37.0.4

2.6、初始化数据库

superset db upgrade

设置用户名密码

export FLASK_APP=superset

flask fab create-admin

最后再初始化

superset init

2.7、superset启动

gunicorn -w 1 -t 120 -b 主机名:8787 "superset.app:create_app()"

-w  worker数量  线程数
-t  timeout   超时时间
-b   bind     绑定IP地址

访问地址为ip:8787

3、数据库连接

3.1、安装mysql连接驱动 

conda install mysqlclient
pip install mysql-connector-python

pip install PyMySQL
 

再次启动superset

ps -ef | awk '/gunicorn/ && !/awk/{print $2}' | xargs kill -9

gunicorn -w 1 -t 120 -b 主机名:8787 "superset.app:create_app()"

3.2、配置连接url 

mysql://root:123456@主机名或者ip/nshop_bi?charset=utf8

### 电商库与Superset集成 #### 库概述 库是一种面向主题的、集成的、相对稳定的、反映历史变化的据集合,主要用于支持企业的决策分析。不同于传统的联机事务处理(OLTP)系统,库采用联机分析处理(OLAP)技术,侧重于对历史据的分析和挖掘,为企业提供全面、准确的决策支持[^1]。 #### Superset简介 Apache Superset 是一款开源的据探索与可视化平台,能够帮助用户轻松创建交互式的仪表板和图表。通过配置 gunicorn 命令可以启动 Superset 应用服务,例如 `gunicorn -w 1 -t 120 -b 主机名:8787 "superset.app:create_app()"` 可用于部署安装 Superset 实例[^3]。 #### 集成方法 为了实现电商库与 Superset 的有效集成,通常遵循以下几个方面: - **连接设置** 使用据库连接字符串来建立从 Superset库的安全链接。这涉及到指定正确的驱动程序、主机地址、端口以及认证凭证等参- **模型定义** 在 Superset 中定义物理表或视图对应的逻辑模型,以便更好地映射到实际的据结构上。这些模型应该反映出库内的维度表和事实表之间的关系。 - **查询优化** 考虑到大规模据集可能带来的性能挑战,在设计 SQL 查询时应充分利用索引、分区等功能,并尽可能减少不必要的列读取操作以提高效率。 - **权限管理** 设定细粒度访问控制策略,确保只有授权人员才能查看敏感信息;同时也要保障普通用户的正常使用体验不受影响。 ```sql -- 这是一个简单的SQL语句示例,展示如何从库中提取销售记录供Superset使用 SELECT date, product_id, SUM(sales_amount) AS total_sales FROM sales_fact_table sf JOIN time_dimension td ON sf.time_key = td.time_key GROUP BY date, product_id; ``` #### 应用场景 一旦成功完成了上述步骤,则可以通过 Superset 对接后的电商平台来进行多种类型的商业智能活动,比如但不限于: - 销售趋势预测; - 客户行为模式识别; - 商品推荐算法训练前的据准备等等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值