想要全面掌握硬盘健康状况,预防数据丢失风险吗?Scrutiny作为一款专业的硬盘S.M.A.R.T监控工具,能够帮助你实时追踪硬盘状态,预测潜在故障。这个完整的硬盘健康监控解决方案结合了制造商提供的S.M.A.R.T指标与真实世界故障率,让你在硬盘出现问题前及时采取措施。
🔍 什么是Scrutiny硬盘监控?
Scrutiny是一个开源的硬盘健康监控仪表板系统,专门用于监控和管理硬盘的S.M.A.R.T数据。与传统的smartd工具相比,Scrutiny提供了更友好的Web界面、历史趋势跟踪和自定义阈值设置功能。
🚀 5步快速部署Scrutiny
1. 环境准备与依赖检查
在开始部署前,确保你的系统已安装Docker环境。Scrutiny支持多种架构,包括Linux、macOS和Windows系统。
2. Docker一键部署
使用官方提供的Docker镜像,只需一条命令即可启动Scrutiny:
docker run -it --rm -p 8080:8080 -p 8086:8086 \
-v `pwd`/scrutiny:/opt/scrutiny/config \
-v `pwd`/influxdb2:/opt/scrutiny/influxdb \
-v /run/udev:/run/udev:ro \
--cap-add SYS_RAWIO \
--device=/dev/sda \
--device=/dev/sdb \
--name scrutiny \
ghcr.io/analogj/scrutiny:master-omnibus
3. 配置硬盘设备访问
确保将系统中所有需要监控的硬盘设备传递给Docker容器。使用--device参数指定设备路径,如/dev/sda、/dev/sdb等。
4. 访问Web界面
部署完成后,打开浏览器访问 http://localhost:8080,你将看到Scrutiny的主仪表板。
5. 首次数据采集
首次访问时,仪表板可能为空。需要手动触发数据收集器运行:
docker exec scrutiny /opt/scrutiny/bin/scrutiny-collector-metrics run
⚙️ 核心配置文件解析
Scrutiny提供两个主要的配置文件:
- Web应用配置:scrutiny.yaml
- 收集器配置:collector.yaml
关键配置项说明
设备检测配置: 在collector.yaml中,可以配置设备检测规则、忽略特定设备或覆盖设备类型。
通知设置: 支持多种通知方式,包括邮件、Webhooks、Discord等,确保在硬盘出现问题时及时收到警报。
📊 监控功能详解
实时S.M.A.R.T监控
Scrutiny自动检测所有连接的硬盘设备,并持续监控关键的S.M.A.R.T属性,包括:
- 重新分配扇区计数
- 寻道错误率
- 温度监控
- 通电时间统计
历史趋势分析
与传统的smartd不同,Scrutiny记录所有S.M.A.R.T属性的历史数据,帮助你识别缓慢退化的趋势。
自定义阈值设置
基于真实世界故障率设置自定义阈值,比制造商提供的默认阈值更加准确和实用。
🔧 高级部署模式
Hub/Spoke分布式部署
对于多服务器环境,Scrutiny支持分布式部署模式:
- 收集器容器:在每个服务器上运行,负责收集本地硬盘数据
- Web应用容器:集中展示所有服务器的硬盘状态
- InfluxDB容器:存储所有历史监控数据
参考docker/example.hubspoke.docker-compose.yml获取完整配置。
🛠️ 故障排除与优化
常见问题解决
设备检测问题: 如果Scrutiny无法检测到某些硬盘,检查docs/TROUBLESHOOTING_DEVICE_COLLECTOR.md获取详细解决方案。
权限配置: 确保Docker容器具有足够的权限访问硬盘设备,特别是NVMe硬盘需要额外添加--cap-add SYS_ADMIN权限。
💡 最佳实践建议
- 定期检查:设置每日自动收集数据,及时发现潜在问题
- 备份配置:定期备份配置文件和数据
- 监控通知:配置合适的通知渠道,确保重要警报不被遗漏
- 性能优化:根据硬盘数量调整数据收集频率
- 日志监控:启用调试日志以便排查问题
通过这5个简单步骤,你就能轻松搭建一个专业的硬盘监控系统。Scrutiny不仅提供了直观的可视化界面,更重要的是能够帮助你预防数据丢失,确保存储系统的稳定运行。立即开始使用Scrutiny,为你的重要数据加上一道安全防线!
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考






