项目中遇见的问题(供大家参考,后续会补充)

etl过程中
如果调度昨天正常运行,今天突然跑的比较慢,这是什么原因(面试题)
我回答的是看日志,然后逐步排查,他又让我举个工作中,遇见的场景,呜呜…

网友提供:

一看上游是不是产出晚了,如果是自己的问题,看是不是数据量有暴增,是不是出现数据倾斜,再看资源问题,是不是集群计算资源不够了(比如大促时期有些任务会挂高级基线抢占集群资源)

还有种情况就是自己的任务比较复杂,资源消耗量大,在资源紧张并且任务优先级不高的时候很容易等待资源

etl超时了,你怎么找到原因,是哪一块超时了

1.日志分析:检查ETL的日志,查看是否有明显的错误或异常信息,例如连接超时、数据库死锁等,定位问题所在。

2.性能监控:使用性能监控工具来监视ETL的运行情况,查看CPU、内存、磁盘和网络等资源的使用情况,是否存在瓶颈或异常。

3.时间分析:将ETL流程分块,记录每一步的运行时间,比较每一步的耗时,找出耗时较长的环节。

4.代码审查:仔细检查ETL代码,尤其是与数据提取、转换和加载相关的部分,查看是否存在低效或冗余的操作,优化代码。

5.并发情况:考虑是否存在多个ETL流程同时运行,造成资源竞争和性能下降,适当调整ETL任务的调度策略或资源分配。

通过以上方法综合分析,应该能够找到ETL超时的原因和具体是哪一块造成了超时问题。

在写存储过程的时候,遇到过什么问题?
第一种,语法没有问题,但是因为上游数据的问题,导致了sql语句运行出错或报异常,这个时候就需要去对存储过程的代码进行异常的捕获
第二种,运行的结果和预期结果不太一致:在存储过程中,在每个判断、循环等位置,写上变量和表格数据的打印,查看一下是否是逻辑问题,然后再查看表格对应的上游数据是否有问题

7.脚本上线之后你都有遇到过哪些问题?是怎么解决的?
第一个是脚本运行时间太长,可能是出现了数据倾斜;
第二个可能是会出现数据和预期不一致的情况,首先看是否是调度工具的问题,其次是逻辑的问题,然后是上游数据的问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一凡888

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值