Oracle Solaris 11.3开工失败问题处理记录

文章讲述了作者在处理一套RAC系统时遇到的问题,重启节点后SSH连接失败,RAC服务未启动。经过一系列排查,发现问题在于/szydrman挂载点有文件导致挂载失败。最后,通过移除挂载点中的文件并重启系统解决了问题。作者反思了粗心大意和对Solaris知识的遗忘,强调了现在支持这种系统的资源稀缺。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、故障现像

起初是我这有套RAC有点问题,我想重启1个节点,结果发现重启后该节点的IP能PING通,但SSH连不上去,对应的RAC服务也没有自动启动。
操作系统是solaris 11.3。由于该IP对应的主机是LDOM,于是我去主域上telnet对应的端口登录到管理CLI,发现如下的报错截图:

image.png

2、故障处理

起初我以为是上图红框的部分有问题,但检查了许久也没找到原因,登录系统里就是无法启动SSH,对应RAC的服务我手动启也是失败,CRS里任何故障日志都没有看到。
后来没办法给O记的工程师打了电话,发了这个截图咨询一下(国内400没有solaris的技术支持,打400只能转接到阿三哥那处理,沟通起来很麻烦,有一次修复solaris我这对话了1天才搞上)。
大佬看图一眼就发现了问题,原因为有个目录/szydrman挂载失败,系统进入到了维护模式,
报错提示就是/szydrman挂载点不为空,导致挂载失败(这点zfs和linux差别很大啊,linux挂载点里写了文件也能挂上)。
于是我在维护模式进到系统里,检查发现确实是有文件,不知道谁把文件扔挂载点里了(可能是之前什么原因挂载点掉了,同时有人往里写文件了)。

image.png

于是尝试把这个挂载点里的文件先移动到别的目录里,再重启系统就恢复了。

3、后记

​总结就是自己粗心大意,不看提示。
​solaris系统用的人越来越少了,虽说我这维护客户手上有,但是这个东西一直稳定,上线再也没调过,早就忘干净了。
国内能支持solaris的人也不多了,除了O记原厂工程师熟悉一些,再就是一些O的代理商的工程师会一些。
后来搜索了一下官方文档有这样一篇记录:
‘svc:/system/filesystem/local:default’ Goes Into Maintenance During Boot ‘zfs mount -a cannot mount ‘/rpool’: directory not empty’ (Doc ID 1503490.1)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

徐sir(徐慧阳)

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值