LSI MegaRAID实战:从零配置硬RAID到系统挂载
1. 认识LSI MegaRAID控制器
第一次接触服务器硬RAID的朋友可能会被各种专业术语吓到,但别担心,LSI MegaRAID控制器其实就像个"硬盘管家"。它通过专门的芯片处理数据冗余和性能优化,比操作系统自带的软RAID更稳定高效。我经手过的几十台服务器里,只要看到这个蓝色LOGO的RAID卡,基本都能放心大胆地做存储配置。
常见的MegaRAID型号包括9361-8i、9440-8i等,尾部数字代表接口数量。比如手头这台服务器配备的是9460-16i,意味着能接16块硬盘。关键点在于:一定要在开机自检时记住进入配置界面的快捷键(通常是Ctrl+H),这个画面往往一闪而过,建议录像或多次尝试。
2. 进入配置界面的正确姿势
开机听到"滴"声后立即狂按Ctrl+H,直到出现蓝底白字的配置界面。这里有个血泪教训:某些服务器可能需要先按F8进入启动菜单,再选择RAID配置入口。如果连续尝试三次都没成功,建议检查键盘连接或查阅服务器手册。
成功进入后你会看到几个关键菜单:
- Configuration Management:阵列配置核心区域
- Controller Management:查看卡状态和固件版本
- Virtual Drive Management:管理已创建的虚拟磁盘
- Drive Management:查看物理硬盘状态
新手最容易犯的错误是直接插拔硬盘。重要提示:任何硬盘操作前,务必先在Drive Management里确认所有磁盘状态显示为"Unconfigured Good"(未配置的良好状态),如果看到"Foreign"标识,需要先执行清除配置操作。
3. 创建RAID阵列的实战步骤
3.1 选择RAID级别
在Configuration Management中选择"Create Virtual Drive",这时要面对第一个重要选择:RAID级别。根据我的经验:
- RAID5:3块盘起配,兼顾安全性和容量,适合普通文件存储
- RAID6:4块盘起配,双冗余更安全但写入性能较低
- RAID10:4块盘起配,读写性能最强但容量折半
如果是存放数据库等重要数据,我强烈建议用RAID10。曾经有个客户坚持用RAID5存财务系统,结果两块盘相继故障导致数据全丢。输入选择时注意:要用空格键选中硬盘,回车键确认选择。
3.2 高级参数设置
创建界面有几个容易忽略但关键的高级选项:
- Strip Size:条带大小,数据库选64KB,视频编辑选1MB
- Read Policy:总是保持"Adaptive Read Ahead"
- Write Policy:有BBU选"Write Back",否则选"Write Through"
- Initialize:选择"Fast Init"能节省数小时等待时间
设置完成后别急着退出,一定要到"Virtual Drive Management"里确认新建的阵列状态显示为"Optimal"。有次我赶时间跳过检查,结果发现有个硬盘没被正确识别,导致阵列降级运行。
4. 操作系统层面的配置技巧
4.1 磁盘识别与格式化
在Linux系统中,用lsblk命令查看刚创建的虚拟磁盘(通常显示为sda、sdb等)。有个实用技巧:如果没立即看到新磁盘,可以执行以下命令强制刷新:
echo "- - -" > /sys/class/scsi_host/host0/scan格式化建议使用ext4文件系统,命令如下:
mkfs.ext4 -O ^has_journal /dev/sda去掉日志功能可以提升约15%的写入性能,特别适合日志类应用。但要注意:这样会增加意外断电时数据损坏的风险,重要数据存储不建议使用。
4.2 自动化挂载配置
编辑/etc/fstab文件时,建议使用UUID而非设备名,因为/dev/sda可能在重启后变化。获取UUID的命令:
blkid /dev/sdafstab添加如下行(以挂载到/storage为例):
UUID=你的UUID /storage ext4 defaults,noatime,nodiratime 0 2参数说明:
- noatime:减少元数据写入
- nodiratime:禁用目录访问时间记录
- 0 2:表示不备份且开机检查
最后执行mount -a测试配置是否正确。我在客户现场见过太多因为fstab配置错误导致系统无法启动的案例,建议先在测试环境验证。
5. 常见故障排查指南
当RAID状态异常时,首先通过MegaRAID管理界面查看具体报警信息。有个快速判断硬盘故障的方法:听声音。正常硬盘运转是平稳的"嗡嗡"声,而即将损坏的硬盘会发出有节奏的"咔嗒"声。
对于突然掉线的硬盘,可以尝试以下恢复步骤:
- 物理检查硬盘供电和数据线
- 在Drive Management中选择"Make Offline"再"Make Online"
- 如果显示为"Foreign"状态,导入外部配置
如果遇到阵列降级(Degraded),千万不要直接重建!先做好数据备份。有次我遇到一块硬盘间歇性故障,重建过程中又坏了一块,导致数据无法恢复。现在我的习惯是:重要数据阵列永远保持热备盘(Hot Spare)。
