使用PyPI安装Apache Superset数据可视化平台
superset 项目地址: https://gitcode.com/gh_mirrors/su/superset
前言
Apache Superset是一款强大的企业级商业智能和数据可视化平台,由Airbnb开源并贡献给Apache软件基金会。本文将详细介绍如何通过Python包索引(PyPI)来安装Superset,帮助开发者快速搭建自己的数据可视化环境。
系统依赖准备
Superset使用Python的cryptography库来加密数据库连接密码,因此需要先安装一些系统级依赖。不同操作系统需要安装的依赖有所不同。
Ubuntu/Debian系统
对于Ubuntu 20.04及更新版本:
sudo apt-get install build-essential libssl-dev libffi-dev python3-dev python3-pip libsasl2-dev libldap2-dev default-libmysqlclient-dev
对于Ubuntu 20.04之前的版本:
sudo apt-get install build-essential libssl-dev libffi-dev python-dev python-pip libsasl2-dev libldap2-dev default-libmysqlclient-dev
CentOS/RHEL/Fedora系统
使用yum包管理器:
sudo yum install gcc gcc-c++ libffi-devel python-devel python-pip python-wheel openssl-devel cyrus-sasl-devel openldap-devel
对于较新版本使用dnf:
sudo dnf install gcc gcc-c++ libffi-devel python3-devel python3-pip python3-wheel openssl-devel cyrus-sasl-devel openldap-devel
CentOS用户可能需要升级pip:
pip3 install --upgrade pip
macOS系统
建议使用最新版macOS系统,并安装XCode命令行工具:
xcode-select --install
推荐使用Homebrew安装依赖:
brew install readline pkg-config libffi openssl mysql postgresql@14
设置必要的环境变量:
export LDFLAGS="-L$(brew --prefix openssl)/lib"
export CFLAGS="-I$(brew --prefix openssl)/include"
Python虚拟环境配置
强烈建议在虚拟环境中安装Superset,以避免与其他Python项目产生依赖冲突。
创建并激活虚拟环境:
python3 -m venv venv
source venv/bin/activate
或者使用pyenv-virtualenv:
pyenv virtualenv superset
pyenv activate superset
升级pip和setuptools:
pip install --upgrade setuptools pip
Superset安装与初始化
安装Superset核心包
pip install apache_superset
配置环境变量
export SUPERSET_SECRET_KEY=your-secret-key-here
export FLASK_APP=superset
初始化数据库
superset db upgrade
创建管理员账户
superset fab create-admin
加载示例数据(可选)
superset load_examples
初始化角色和权限
superset init
启动开发服务器
superset run -p 8088 --with-threads --reload --debugger
启动成功后,可以通过浏览器访问localhost:8088
,使用之前创建的管理员账户登录。
常见问题解决
-
依赖安装失败:确保已安装所有系统依赖,特别是开发工具链和SSL相关库。
-
Python版本问题:Superset支持Python 3.7及以上版本,建议使用最新稳定版。
-
虚拟环境问题:如果遇到权限问题,可以尝试使用
--user
标志安装pip包。 -
数据库连接问题:确保已安装并配置好所需的数据库驱动(如MySQL、PostgreSQL等)。
生产环境注意事项
本文介绍的是开发环境安装方式。在生产环境中,建议:
- 使用Gunicorn或uWSGI等生产级WSGI服务器
- 配置Nginx或Apache作为反向代理
- 设置适当的数据库连接池
- 配置定期备份策略
通过以上步骤,您应该已经成功搭建了一个Superset开发环境,可以开始探索其强大的数据可视化功能了。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考