airflow系列之K8S多Worker节点安装后问题总结与自定义镜像并传参

1. K8S多Worker节点安装后问题总结

1.1 卸载重新安装无法登录问题

还记得install.sh吗,我把创建用户关闭了,并且删除了airflow_plus数据库,以下配置导致不创建默认用户,所以登录不进去,设置为true,重新install即可

# 关闭创建用户job
--set webserver.defaultUser.enabled=false \

1.2 Worker节点重启导致任务失败问题

原因为自定义安装依赖,版本冲突导致。检查重启Worker所在pod的事件,查看信息如下

"/home/airflow/.local/lib/python3.7/site-packages/kombu/entity.py", line 7, in <module> from .serialization import prepare_accept_content File "/home/airflow/.local/lib/python3.7/site-packages/kombu/serialization.py", line 440, in <module> for ep, args in entrypoints('kombu.serializers'): # pragma: no cover File "/home/airflow/.local/lib/python3.7/site-packages/kombu/utils/compat.py", line 82, in entrypoints for ep in importlib_metadata.entry_points().get(namespace, []) AttributeError: 'EntryPoints' object has no attribute 'get'

检查依赖,把依赖版本固定

importlib-metadata==4.13.0

1.3 动态安装依赖问题

  • 对于单worker节点,可以每次任务前前执行安装方法,但是比较麻烦,不实用:
import logging
import os
log = logging.getLogger(__name__)

def install():
    log.info("begin install requirements")
    os.system("pip install -r /opt/airflow/dags/repo/dags/requirements.txt")
    os
在有向无环图(Directed Acyclic Graph, DAG)中,后门路径混淆路径相关。混淆路径是同时包含正向和反向边的路径,例如A←C→B,其中C是A和B的混淆变量,会导致虚假相关性。后门路径本质上就是这样的混淆路径,它是不经过从原因到结果的有向路径,而是通过其他路径连接原因和结果的路径,这些路径上存在混淆变量,可能会干扰对变量间真实因果关系的判断。 在因果分析中,“后门准则”(Backdoor Criterion)可用于排除后门路径带来的混淆。通过识别和控制后门路径上的混淆变量,能够更准确地估计变量之间的因果效应。例如在代码示例中,使用`dowhy`库构建因果模型时,采用“后门调整”方法来估计因果效应,就是为了处理可能存在的后门路径问题,从而得到更可靠的因果关系推断结果 [^1][^3]。 ```python import dowhy from dowhy import CausalModel import pandas as pd # 构建因果图(假设BMI是血糖的因,血糖是疾病进展的因) graph = """ digraph { BMI -> s5; s5 -> disease_progression; age -> disease_progression; } """ # 假设已经有测试数据 X_test 和 y_test model = CausalModel( data=pd.concat([X_test, pd.Series(y_test, name="disease_progression")], axis=1), treatment="s5", # 关注的干预变量(血糖指标) outcome="disease_progression", # 结果变量 graph=graph.replace("\n", " ") ) # 估计因果效应(使用后门调整) identified_estimand = model.identify_effect() estimate = model.estimate_effect( identified_estimand, method_name="backdoor.linear_regression" ) print(f"血糖指标对疾病进展的因果效应(平均):{estimate.value:.2f}") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

算法小生Đ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值