企业级SSD在存储系统的部署运维过程中,有时会需要收集日志信息做进一步问题调试分析,传统的做法是一些SSD厂商会自定义命令和工具进行收集,但不同SSD厂商工具和命令格式不尽相同,这就为存储系统的运维带来很高的运维成本。有些存储系统对SSD要求十分严格,不允许发一些自定义的命令,也会给日志收集工作带来很大的挑战。因此,Telemetry标准化日志收集接口应运而生。
Telemetry 是什么?
Telemetry是 NVM Express Base Specification 定义的错误日志收集标准接口,是NVMe1.3新增功能。Telemetry通过统一的标准接口来收集SSD厂商自定义数据日志,用户下发一条标准命令就可以获取需要的日志,然后将收集到的日志发给SSD厂商做进一步日志分析,降低为了收集日志需要将SSD从部署系统移出的可能性,有效减少现场debug时间,提升用户运维效率。Telemetry典型应用场景如现场失效分类,周期性健康监控,问题定位等,快速定位问题并解析,进一步提高产品可靠性。
Memblaze PCIe4.0 PBlaze6系列开始全线支持Telemetry功能。
Telemetry日志收集方式:Host/Controller-Initiated
Telemetry功能定义了收集SSD厂商自定义日志的机制,Telemetry数据采集可以是Host-Initiated和Controller-Initiated,前者是host发起获取SSD一些关键信息,后者是SSD认为重要的数据,由SSD厂商自定义。

Host发起的收集数据记录在Telemetry Host-Initiated Log,Controller发起的收集数据记录在Telemetry Controller-Initiated Log。<

Telemetry是NVMe1.3引入的错误日志收集标准,旨在统一不同SSD厂商的日志格式,降低存储系统运维成本。它通过Host/Controller-Initiated两种方式收集日志,简化现场故障排查。Memblaze PBlaze6系列已支持此功能。Telemetry日志分为Host-Initiated和Controller-Initiated两种,数据区分为三个阶段,便于逐步深入分析问题。OCP2.0协议进一步扩展了Telemetry日志收集能力,增加了PCIe VDM支持。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



