- 博客(95)
- 资源 (9)
- 问答 (5)
- 收藏
- 关注
原创 airflow看不到任务日志解决方案
airflow web-server 界面,看到某些任务的具体运行日志,只有少量日志,改文章主要解决该问题。
2024-08-30 19:41:00
900
原创 hive sql 处理多层 json 数组
通过 hive sql,展开包含多层 json 数组的字符串,然后获取到每个子 json 中的值。
2024-08-15 11:29:03
1706
1
原创 恢复HDFS上误删除的文件
HDFS 为我们提供了垃圾箱的功能,也就是说当我们执行 hadoop fs -rmr xxx命令之后,文件并不是马上被删除,而是会被移动到,等到一定的时间后才会执行真正的删除操作。从上面的例子中可以看出,在我们删了 test.txt 文件之后,文件被移到路径下,如果这个操作属于误操作,我们则可以到回收站找回这个文件并直接mv回原来的目录,即可恢复之前的数据。不过使用这个功能的前提是我们配置了 fs.trash.interval参数,默认是 0,代表不启用垃圾箱功能。</</</</
2023-06-30 16:23:58
2165
原创 程序监控报警失败自动重启脚本
运行在服务器上的一些组件服务,比如大数据的 hadoop、hive、hbase,或者是自己写的一些需要长时间运行的程序,我们启动了之后,是不会经常去观察这些程序的运行状态的。正常情况下这是没问题的,但有时候,程序在运行过程中,会由于机器的负载,或者是其他的一些环境不稳定因素,到会程序停止运行。如果我们没有设计什么监控的话,只能在出现问题时,登录机器查看组件或程序运行的情况,这是非常被动的,如果影响到业务,会更严重,所以我们需要增加一些组件或程序运行的监控、报警和失败重启脚本。
2023-03-31 20:51:59
571
原创 flink-sql查询配置与性能优化参数详解-1.15
本博客为 flink 1.15 版本中 flink sql 的优化和配置不分的内容翻译整理
2022-11-17 16:24:47
1622
原创 flink-sql查询配置与性能优化参数详解-1.14
本博客为 flink 1.14 版本中 flink sql 配置和性能优化的相关内容翻译整理。
2022-11-17 11:32:20
1520
Spark2中使用累加器、注意点以及实现自定义累加器.docx
2019-08-21
IntelliJIDEA的安装、配置与使用.docx
2019-08-12
Webyog_Sqlyog_Ultimate_13.1.1
2019-04-30
modbus4j 相关jar包 3.0.5-SNAPSHOT.jar
2018-12-24
modbus4j 相关jar包 3.0.4
2018-12-24
securecrt 32位官方安装包
2018-08-27
securecrt 64位官方安装包
2018-08-27
CDH 的 HUE 界面表加载列出错。
2023-04-04
flink sql on hive 批处理
2021-04-22
CDH6.3.1 CDH6.3.2安装
2020-06-06
windows和linux互相ping的问题
2019-06-21
slf4j logback日志输出至不同的文件中,日志文件名在程序中动态指定
2018-06-28
CDH中HUE的账号权限问题
2018-03-20
TA创建的收藏夹 TA关注的收藏夹
TA关注的人