运维
文章平均质量分 61
码农在失业
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Dolphinscheduler执行工作流失败,后台报duplicate key错误
现场童鞋发来一张图如下哦,现场临时搭建了dolphinscheduler,然后导入工作流后报错了,再也看不到正在运行的工作流实例,后台看看,如图哦豁,报错了,看样子这个t_ds_trigger_relation表有点问题呀。原创 2025-05-19 17:07:25 · 310 阅读 · 0 评论 -
现场血案:Kafka CRC 异常
现场童鞋说客户的研发环境突然在近期间歇式的收到了CRC的相关异常,异常内容如下报错完全没有规律性,有可能半天都不出现一次,也有可能一小时出现2、3次而这个报错会导致Kafka的Consumer hang死,即无法继续消费后续的消息,只能手动重启Consumer才能继续,是非常严厉的报错,会直接导致生产不可用另外,我们部署的供内部云平台组建使用的Kafka也会出现这种报错。原创 2025-05-16 17:20:44 · 1350 阅读 · 0 评论 -
c86机器安装nvaid显卡驱动报错:ERROR:Unable to load the kernel module ‘nvidia.ko‘.
最近小伙伴要去北京甲方现场搭建我们的AI编码服务,需要使用GPU机器跑大模型,根据现场提供的信息是2台C86的机器,显卡够够的,但是现场是内网环境,因此,需要先准备好需要的安装包,当然,这些都已经在我们的安装包中。其中一台正常安装,另一台安装时报错ERROR:Unable to load the kernel module 'nvidia.ko'.,如下图。原创 2025-01-20 17:28:48 · 1746 阅读 · 0 评论 -
Dolphinscheduler安装部署
最近有其它团队的小伙伴找来,要整个数据编排的东东,哎,咋这么巧,最近刚好在github上看到dolphinscheduler这个东东,所以就推荐给小伙伴,并提供了安装方法。原创 2025-01-13 17:19:16 · 1274 阅读 · 0 评论 -
一次Kafka启动失败引出的问题
Some time,有个现场童鞋说咱的Kafka实例有个broker一直crash,还截图给我看了,大致是Kafka启动加载topic分区日志文件的时候,然后就没了,连个WARN都没有。当然,光看这个截图咱啥都不知道,因此只能搞个会议一起看看,这里说一下,公司内部聊天软件太菜了,所以就用腾讯会议,嗯,挺好的,反正是免费的。原创 2024-12-02 20:18:49 · 730 阅读 · 0 评论 -
RocketMQ常用命令
master-slave模式下获取当前master信息。如果在容器内部中,可能需要先执行下面命令。tool.sh工具测试收发消息。原创 2024-12-02 19:57:40 · 909 阅读 · 0 评论
分享