RAID卡

本文介绍了RAID卡的基本概念和常见的RAID模式。在Linux环境下,详细阐述了如何安装和使用RAID卡工具,特别是在/opt/MegaRAID/storcli目录下执行相关命令来查看RAID数量和状态,包括RAID1和RAID5的配置信息。

RAID卡

简介

RAID模式介绍

Linux下raid卡工具

安装

使用

进入/opt/MegaRAID/storcli,只有在这个目录下,才能执行(因为没有加入系统path)。
Raid数量及当前状态

[root@seg1 storcli]# pwd
/opt/MegaRAID/storcli
[root@seg1 storcli]# ./storcli64 show ctrlcount
Status Code = 0
Status = Success
Description = None

Controller Count = 1

查看基础信息

[root@seg1 storcli]# ./storcli64 /c0 show
Generating detailed summary of the adapter, it may take a while to complete.

Controller = 0
Status = Success
Description = None

Product Name = LSI MegaRAID SAS 9271-8i
Serial Number = SV45208424
SAS Address =  500605b009e8c730
PCI Address = 00:03:00:00
System Time = 02/08/2017 11:10:11
Mfg. Date = 12/22/14
Controller Time = 02/08/2017 03:10:33
FW Package Build = 23.12.0-0011
BIOS Version = 5.38.00_4.12.05.00_0x05270000
FW Version = 3.240.05-2282
Driver Name = megaraid_sas
Driver Version = 06.807.10.00-rh1
Vendor Id = 0x1000
Device Id = 0x5B
SubVendor Id = 0x1000
SubDevice Id = 0x9271
Host Interface = PCIE
Device Interface = SAS-6G
Bus Number = 3
Device Number = 0
Function Number = 0
Drive Groups = 2

TOPOLOGY :
========

--------------------------------------------------------------------------
DG Arr Row EID:Slot DID Type  State BT       Size PDC  PI SED DS3  FSpace 
--------------------------------------------------------------------------
 0 -   -   -        -   RAID1 Optl  N  744.687 GB enbl N  N   none N      
 0 0   -   -        -   RAID1 Optl  N  744.687 GB enbl N  N   none N      
 0 0   0   8:0      11  DRIVE Onln  N  744.687 GB enbl N  N   none -      
 0 0   1   8:1      12  DRIVE Onln  N  744.687 GB enbl N  N   none -      
 1 -   -   -        -   RAID5 Optl  N    6.544 TB enbl N  N   none N      
 1 0   -   -        -   RAID5 Optl  N    6.544 TB enbl N  N   none N      
 1 0   0   8:2      9   DRIVE Onln  N  744.687 GB enbl N  N   none -      
 1 0   1   8:3      18  DRIVE Onln  N  744.687 GB enbl N  N   none -      
 1 0   2   8:4      10  DRIVE Onln  N  744.687 GB enbl N  N   none -      
 1 0   3   8:5      14  DRIVE Onln  N  744.687 GB enbl N  N   none -      
 1 0   4   8:6      16  DRIVE Onln  N  744.687 GB enbl N  N   none -      
 1 0   5   8:7      13  DRIVE Onln  N  744.687 GB enbl N  N   none -      
 1 0   6   8:8      17  DRIVE Onln  N  744.687 GB enbl N  N   none -      
 1 0   7   8:9      15  DRIVE Onln  N  744.687 GB enbl N  N   none -      
 1 0   8   8:10     20  DRIVE Onln  N  744.687 GB enbl N  N   none -      
 1 0   9   8:11     19  DRIVE Onln  N  744.687 GB enbl N  N   none -      
--------------------------------------------------------------------------

DG=Disk Group Index|Arr=Array Index|Row=Row Index|EID=Enclosure Device ID
DID=Device ID|Type=Drive Type|Onln=Online|Rbld=Rebuild|Dgrd=Degraded
Pdgd=Partially degraded|Offln=Offline|BT=Background Task Active
PDC=PD Cache|PI=Protection Info|SED=Self Encrypting Drive|Frgn=Foreign
DS3=Dimmer Switch 3|dflt=Default|Msng=Missing|FSpace=Free Space Present

Virtual Drives = 2

VD LIST :
=======

-----------------------------------------------------------
DG/VD TYPE  State Access Consist Cache sCC       Size Name 
-----------------------------------------------------------
0/0   RAID1 Optl  RW     Yes     RWBD  -   744.687 GB      
1/1   RAID5 Optl  RW     Yes     RWBD  -     6.544 TB      
-----------------------------------------------------------

Cac=CacheCade|Rec=Recovery|OfLn=OffLine|Pdgd=Partially Degraded|dgrd=Degraded
Optl=Optimal|RO=Read Only|RW=Read Write|B=Blocked|Consist=Consistent|
R=Read Ahead Always|NR=No Read Ahead|WB=WriteBack|
AWB=Always WriteBack|WT=WriteThrough|C=Cached IO|D=Direct IO|sCC=Scheduled
Check Consistency

Physical Drives = 12

PD LIST :
=======

----------------------------------------------------------------------------
EID:Slt DID State DG       Size Intf Med SED PI SeSz Model               Sp 
----------------------------------------------------------------------------
8:0      11 Onln   0 744.687 GB SATA SSD N   N  512B INTEL SSDSC2BB800G4 U  
8:1      12 Onln   0 744.687 GB SATA SSD N   N  512B INTEL SSDSC2BB800G4 U  
8:2       9 Onln   1 744.687 GB SATA SSD N   N  512B INTEL SSDSC2BB800G4 U  
8:3      18 Onln   1 744.687 GB SATA SSD N   N  512B INTEL SSDSC2BB800G4 U  
8:4      10 Onln   1 744.687 GB SATA SSD N   N  512B INTEL SSDSC2BB800G4 U  
8:5      14 Onln   1 744.687 GB SATA SSD N   N  512B INTEL SSDSC2BB800G4 U  
8:6      16 Onln   1 744.687 GB SATA SSD N   N  512B INTEL SSDSC2BB800G4 U  
8:7      13 Onln   1 744.687 GB SATA SSD N   N  512B INTEL SSDSC2BB800G4 U  
8:8      17 Onln   1 744.687 GB SATA SSD N   N  512B INTEL SSDSC2BB800G4 U  
8:9      15 Onln   1 744.687 GB SATA SSD N   N  512B INTEL SSDSC2BB800G4 U  
8:10     20 Onln   1 744.687 GB SATA SSD N   N  512B INTEL SSDSC2BB800G4 U  
8:11     19 Onln   1 744.687 GB SATA SSD N   N  512B INTEL SSDSC2BB800G4 U  
----------------------------------------------------------------------------

EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
SeSz-Sector Size|Sp-Spun|U-Up|D-Down|T-Transition|F-Foreign
UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
CFShld-Configured shielded


Cachevault_Info :
===============

------------------------------------
Model  State   Temp Mode MfgDate    
------------------------------------
CVPM02 Optimal 24C  -    2014/10/20 
------------------------------------

查询虚拟磁盘大小,raid结构等.
因为有2个raid配置,分别执行v0和v1来看,发现第一个做的是RAID1,第二个做的是RAID5

[root@seg1 storcli]# ./storcli64 /c0 /v0 show
Controller = 0
Status = Success
Description = None


Virtual Drives :
==============

-----------------------------------------------------------
DG/VD TYPE  State Access Consist Cache sCC       Size Name 
-----------------------------------------------------------
0/0   RAID1 Optl  RW     Yes     RWBD  -   744.687 GB      
-----------------------------------------------------------

Cac=CacheCade|Rec=Recovery|OfLn=OffLine|Pdgd=Partially Degraded|dgrd=Degraded
Optl=Optimal|RO=Read Only|RW=Read Write|B=Blocked|Consist=Consistent|
R=Read Ahead Always|NR=No Read Ahead|WB=WriteBack|
AWB=Always WriteBack|WT=WriteThrough|C=Cached IO|D=Direct IO|sCC=Scheduled
Check Consistency

[root@seg1 storcli]# ./storcli64 /c0 /v1 show
Controller = 0
Status = Success
Description = None


Virtual Drives :
==============

---------------------------------------------------------
DG/VD TYPE  State Access Consist Cache sCC     Size Name 
---------------------------------------------------------
1/1   RAID5 Optl  RW     Yes     RWBD  -   6.544 TB      
---------------------------------------------------------

Cac=CacheCade|Rec=Recovery|OfLn=OffLine|Pdgd=Partially Degraded|dgrd=Degraded
Optl=Optimal|RO=Read Only|RW=Read Write|B=Blocked|Consist=Consistent|
R=Read Ahead Always|NR=No Read Ahead|WB=WriteBack|
AWB=Always WriteBack|WT=WriteThrough|C=Cached IO|D=Direct IO|sCC=Scheduled
Check Consistency
<think>首先,用户的问题是关于RAID的:功能、配置和故障排除。我需要根据系统级指令来构建回答。 系统级指令: - 所有行内数学表达式必须使用$...$格式。 - 独立公式必须使用$$...$$格式并单独成段。 - LaTeX语法正确。 - 使用中文回答。 - 生成相关问题。 - 回答中引用的段落末尾自然地添加引用标识。 - 回答结构清晰,帮助用户逐步解决问题,保证回答真实可靠。 用户提供的引用: - 引用[1]:关于RAID故障导致服务器异常关机排查方法,提到进入RA配置界面检查Virtual Disk状态。 - 引用[2]:关于常用RAID管理工具手册,提到SSACLI工具。 用户的问题焦点是RAID的功能、配置和故障排除。所以,我需要组织回答来覆盖这些方面。 回答结构: 1. **介绍RAID的功能**:解释什么是RAID,它的主要作用。 2. **配置RAID**:如何配置RAID,包括步骤和工具。 3. **故障排除**:常见故障及其解决方法,基于提供的引用。 在回答中,我需要自然地添加引用标识。例如,当提到故障排查方法时,引用[1]。 生成相关问题:在回答结束后,添加相关问题部分,类似于示例中的“相关问题”。 由于指令要求使用中文,所有内容都必须是中文。 可能的数学表达式:在RAID上下文中,数学表达式可能不常见,但如果涉及性能计算,比如RAID级别中的冗余计算,我可以适当地使用行内数学。例如,在解释RAID 5时,奇偶校验的计算可以用$...$格式。但不要强制添加数学;只有在相关时使用。 步骤: 1. **功能**:简要介绍RAID的功能。 2. **配置**:描述配置过程,包括工具如SSACLI(来自引用[2])。 3. **故障排除**:基于引用[1],讨论如何排查故障。 最后,添加相关问题。 引用标识:在相关段落末尾添加[^1]或[^2],基于提供的引用。 完整的回答结构: - 开头:概述RAID。 - 功能部分。 - 配置部分。 - 故障排除部分。 - 相关问题。 确保回答真实可靠:基于通用知识和提供的引用。RAID是常见的服务器组件,所以我可以依赖标准信息。 生成相关问题: 1. RAID有哪些常见类型? 2. 如何优化RAID的性能? 3. RAID故障的预防措施? 现在,草拟回答。</think>### RAID功能、配置与故障排除指南 RAID(Redundant Array of Independent Disks Controller)是服务器中的关键硬件组件,用于管理多个硬盘驱动器(HDD或SSD),通过数据冗余、条带化或镜像技术提升存储性能、可靠性和容量[^1]。本指南将基于您的需求,从功能、配置到故障排除逐步展开,确保回答真实可靠(参考通用服务器知识及您提供的引用资料)。 #### 一、RAID核心功能 RAID的核心功能是实现RAID级别(如RAID 0, 1, 5, 10等),通过硬件加速处理数据读写。主要优势包括: - **数据冗余**:在RAID 1或5中,使用奇偶校验确保数据安全。例如,RAID 5的奇偶校验计算涉及模2加法:$P = D_1 \oplus D_2 \oplus \cdots \oplus D_n$(其中$D_i$为数据块,$P$为奇偶块),这能容忍单块硬盘失效[^1]。 - **性能提升**:条带化(RAID 0)将数据分块写入多个硬盘,提升I/O吞吐量,适用于高负载应用如数据库。 - **容量扩展**:支持将多个物理硬盘组合成逻辑卷(Virtual Disk),简化存储管理。 - **热插拔支持**:允许在服务器运行时更换故障硬盘,减少停机时间。 这些功能通过RAID的专用处理器和缓存实现,比软件RAID更高效。例如,缓存策略(如Write-Back)可加速写入操作,但需配合电池备份单元(BBU)防止数据丢失[^2]。 #### 二、RAID配置步骤 配置RAID通常在服务器启动时进行,需进入RAID配置界面(如HPE Smart Array控制器的Ctrl+R或Ctrl+H组合键)。以下是通用配置流程(以HPE服务器为例,参考SSACLI工具[^2]): 1. **访问配置界面**: - 重启服务器,在POST(开机自检)阶段按指定键(如Ctrl+R)进入RAIDBIOS界面。 - 或使用操作系统工具:如HPE的SSACLI命令行工具,支持远程管理。基本命令示例: ```bash ssacli ctrl all show status # 查看控制器状态 ssacli ctrl slot=0 create type=ld drives=1I:1:1,1I:1:2 raid=1 # 创建RAID 1逻辑卷 ``` 2. **创建逻辑卷(Virtual Disk)**: - 选择物理硬盘:在界面中标记硬盘,指定为RAID成员。 - 设置RAID级别:根据需求选择(如RAID 5用于平衡性能与冗余)。RAID 5的最小硬盘数为3,容量公式为$C = (n-1) \times S_{\min}$($n$为硬盘数,$S_{\min}$为最小硬盘容量)[^1]。 - 配置缓存策略:例如,启用Write-Back缓存提升写入速度,但需确保BBU状态正常。 3. **验证与优化**: - 使用SSACLI检查配置:`ssacli ctrl slot=0 ld all show detail` 显示逻辑卷详情。 - 固件与驱动更新:定期升级RAID固件和驱动程序,避免兼容性问题(参考引用[2])。 - 最佳实践:建议在关键系统使用RAID 10(镜像+条带化),兼顾性能与安全。 配置完成后,逻辑卷会显示为操作系统中的单个磁盘。注意:不同厂商(如Dell PERC或LSI)工具可能略有差异,但核心步骤类似。 #### 三、常见故障排除方法 RAID故障可能导致服务器异常关机、数据丢失或性能下降。以下是基于引用[1]的排查流程: 1. **初步诊断**: - 服务器重启时观察POST错误信息(如“RAID Degraded”)。 - 进入RAID配置界面(Ctrl+R),检查Virtual Disk状态: - 正常:显示“Normal”。 - 异常:如“Degraded (1/2)”表示1块硬盘失效,需立即更换[^1]。 2. **硬件检查**: - 硬盘状态:移除故障硬盘(热插拔),并插入新硬盘。RAID应自动重建(Rebuild)。重建时间取决于数据量,可用进度公式估算:$T \approx \frac{D}{R}$($D$为数据大小,$R$为重建速率)。 - RAID自身故障:检查LED指示灯(如琥珀色表示错误),或使用管理工具验证控制器健康度。 3. **软件与固件排查**: - 固件验证:引用[1]强调固件问题可能导致异常关机。升级固件前备份配置,使用厂商工具(如HPE SSACLI的`ssacli ctrl all update firmware`)[^2]。 - 驱动冲突:在操作系统中检查RAID驱动日志(如Linux的dmesg或Windows事件查看器),重新安装驱动。 - 缓存问题:禁用Write-Back缓存测试是否解决数据损坏(引用[2]提到缓存策略管理)。 4. **高级工具使用**: - 利用SSACLI执行深度诊断:`ssacli ctrl slot=0 diag file=report.txt` 生成报告。 - 数据恢复:如RAID崩溃,使用专业工具(如TestDisk)尝试恢复,但优先联系厂商支持。 常见故障原因包括硬盘老化、固件bug或电源问题。预防措施包括定期S.M.A.R.T.检测和冗余配置[^1]。 #### 相关问题 为帮助您进一步探索,以下是基于本指南生成的相关问题: 1. RAID的不同级别(如RAID 5 vs RAID 10)在性能和冗余上如何比较? 2. 如何更新RAID的固件和驱动程序以预防故障? 3. RAID故障后,数据恢复的最佳实践是什么? 如需特定场景(如HPE服务器)的详细配置或工具命令,请提供更多细节,我会补充解答。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值