大数据学习教程SD版第十七篇【Airflow】

本文介绍了Apache Airflow的安装、架构、UI操作、DAG创建、Metadata数据库切换及核心使用,强调其作为任务调度和ETL工具的角色,提供Python和Shell任务执行,并探讨了为何在大数据工作流中使用Shell脚本。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Airflow 任务调度工具+ETL工具(不常用)

Apache开源 ,编程(Python)、调度、监控 (UI) 动态 可扩展 优雅 可伸缩 上手简单

1. Airflow 安装

  • 本地安装
# 最好使用conda创建一个虚拟Python环境,防止本机Python环境不兼容
# 0.config
export AIRFLOW_HOME=/opt/module/airflow
AIRFLOW_VERSION=2.2.3
PYTHON_VERSION="$(python --version | cut -d " " -f 2 | cut -d "." -f 1-2)"
CONSTRAINT_URL="https://raw.githubusercontent.com/apache/airflow/constraints-${AIRFLOW_VERSION}/constraints-${PYTHON_VERSION}.txt"
# 1. install
pip install "apache-airflow==${AIRFLOW_VERSION}" --constraint "${CONSTRAINT_URL}"

# 2.init db
airflow db init

# 3.create admin
airflow users create \
    --username airflow \
    --firstname jin \
    --lastname suo \
    --role Admin \
    --email jinsuo@eamil.com
    
# 4. run
airflow webserver --port 8080 -D
airflow scheduler -D

# 5.stop
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

道-闇影

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值