Wie bereits im Artikel Mein RAID5 löst sich auf beschrieben, zeigte eine der Samsung Platten in meinem privaten Rechner Ermüdungserscheinungen.
Heute war es dann endlich so weit, vom Cron-Daemon bekam ich folgende E-Mail:
Subject: Warning: Degraded RAID detected on lisa.local
Date: Sun, 15 Apr 2007 21:00:02 +0200 (CEST)Personalities : [raid0] [raid1] [raid6] [raid5] [raid4]
md1 : active raid1 sdd1[3] sdc1[2] sdb1[1] hda1[0]
96256 blocks [4/4] [UUUU]md2 : active raid5 sdd2[3] sdc2[2] sdb2[0] sda2[4](F)
17566848 blocks level 5, 64k chunk, algorithm 2 [4/3] [U_UU]md3 : active raid5 sdd3[3] sdc3[2] sdb3[1] sda3[4](F)
216684288 blocks level 5, 128k chunk, algorithm 2 [4/3] [_UUU]unused devices: <none>
Wie ihr seht, hatte ich hda1 bereits als Ersatz für sda1 im RAID md1 (/boot-Partition) in Benutzung, nun verabschiedete sich sda2 aus md2 (/) und sda3 aus md3 (/home), zu erkennen an dem (F) - F wie Faulty.
Das dumme war nun, daß die IDE-Platte hda mit 9729 Zylindern um genau 4 Zylinder kleiner war als die Samsung SATA-Platten - mit mal eben 2 Partitionen auf hda1 anlegen und zu den MD-Devices dazupacken war es leider nicht getan.
Im Endeffekt lief es darauf hinaus, md1 zu verkleinern, damit alle 3 Partitionen auf hda gross genug wären für die RAID-Devices.
Was folgte, war hda1 aus md1 zu entfernen, ein Backup der Daten aus /boot zu machen, md1 mit mdadm zu verkleinern, die Daten zurückzuspielen und 3 neue Partitionen auf hda anzulegen, diesmal mit einer um ein paar Blocks kleineren Partition hda1.
Dann kurz mit mdadm /dev/md$foo -a /dev/hda$foo die 3 Partitionen den 3 RAID-Devices hinzufügen und fertig ist der Lack:
Personalities : [raid0] [raid1] [raid6] [raid5] [raid4]
md1 : active raid1 hda1[0] sdd1[3] sdc1[2] sdb1[1]
32768 blocks [4/4] [UUUU]md2 : active raid5 hda2[1] sdd2[3] sdc2[2] sdb2[0]
17566848 blocks level 5, 64k chunk, algorithm 2 [4/4] [UUUU]md3 : active raid5 hda3[4] sdd3[3] sdc3[2] sdb3[1]
216684288 blocks level 5, 128k chunk, algorithm 2 [4/3] [_UUU]
[===>.................] recovery = 16.2% (11748992/72228096) finish=27.8min speed=36228K/secunused devices: <none>
Eine halbe Stunde später sollte dann, wenn alles gut geht, das RAID5 wieder redundant und damit fault-tolerant sein.
{ 2 } Comments
... und nächste Woche sehen sie bei "Backen mit Meckel" einen leckeren BIOS-Kuchen!
Umständlich!
Aber solange die Daten noch da sind...