NVMe磁盘IO超时参数配置不当, 导致NVMe磁盘不可用
Linux系统的ECS实例中NVMe磁盘IO超时参数配置不当, 导致NVMe磁盘不可用如何处理?
NVMe驱动中的 io_timeout参数控制了最大能够容忍的I/O超时时间,如果I/O读写操作的延迟过高,超过了该参数的配置值,则NVMe驱动会返回I/O失败,可能导致NVMe磁盘上的文件系统从原来挂载的可读、写的状态,切换为只读不可写的状态,后续的写操作均失败,从而导致系统和应用程序异常或者业务中断。
大部分Linux发行版本中io_timeout参数默认配置为30秒。为了减少NVMe磁盘的IO操作超时出现的异常情况,通常需要将 io_timeout参数设置为最大值。在新版本的内核中,io_timeout参数的最大值为4,294,967,295秒,较早版本中为255秒。
不同的版本内核中,NVMe驱动的内核模块也不同,部分内核模块为nvme.ko ,部分内核模块为nvme_core.ko,所以完整的超时参数名称存在nvme.io_timeout和nvme_core.io_timeout两种可能。
3953

被折叠的 条评论
为什么被折叠?



