Skip to content

RAID5 Recovery

Wie bereits im Artikel Mein RAID5 löst sich auf beschrieben, zeigte eine der Samsung Platten in meinem privaten Rechner Ermüdungserscheinungen.

Heute war es dann endlich so weit, vom Cron-Daemon bekam ich folgende E-Mail:

Subject: Warning: Degraded RAID detected on lisa.local
Date: Sun, 15 Apr 2007 21:00:02 +0200 (CEST)

Personalities : [raid0] [raid1] [raid6] [raid5] [raid4]
md1 : active raid1 sdd1[3] sdc1[2] sdb1[1] hda1[0]
96256 blocks [4/4] [UUUU]

md2 : active raid5 sdd2[3] sdc2[2] sdb2[0] sda2[4](F)
17566848 blocks level 5, 64k chunk, algorithm 2 [4/3] [U_UU]

md3 : active raid5 sdd3[3] sdc3[2] sdb3[1] sda3[4](F)
216684288 blocks level 5, 128k chunk, algorithm 2 [4/3] [_UUU]

unused devices: <none>

Wie ihr seht, hatte ich hda1 bereits als Ersatz für sda1 im RAID md1 (/boot-Partition) in Benutzung, nun verabschiedete sich sda2 aus md2 (/) und sda3 aus md3 (/home), zu erkennen an dem (F) - F wie Faulty.

Das dumme war nun, daß die IDE-Platte hda mit 9729 Zylindern um genau 4 Zylinder kleiner war als die Samsung SATA-Platten - mit mal eben 2 Partitionen auf hda1 anlegen und zu den MD-Devices dazupacken war es leider nicht getan.

Im Endeffekt lief es darauf hinaus, md1 zu verkleinern, damit alle 3 Partitionen auf hda gross genug wären für die RAID-Devices.

Was folgte, war hda1 aus md1 zu entfernen, ein Backup der Daten aus /boot zu machen, md1 mit mdadm zu verkleinern, die Daten zurückzuspielen und 3 neue Partitionen auf hda anzulegen, diesmal mit einer um ein paar Blocks kleineren Partition hda1.

Dann kurz mit mdadm /dev/md$foo -a /dev/hda$foo die 3 Partitionen den 3 RAID-Devices hinzufügen und fertig ist der Lack:

Personalities : [raid0] [raid1] [raid6] [raid5] [raid4]
md1 : active raid1 hda1[0] sdd1[3] sdc1[2] sdb1[1]
32768 blocks [4/4] [UUUU]

md2 : active raid5 hda2[1] sdd2[3] sdc2[2] sdb2[0]
17566848 blocks level 5, 64k chunk, algorithm 2 [4/4] [UUUU]

md3 : active raid5 hda3[4] sdd3[3] sdc3[2] sdb3[1]
216684288 blocks level 5, 128k chunk, algorithm 2 [4/3] [_UUU]
[===>.................] recovery = 16.2% (11748992/72228096) finish=27.8min speed=36228K/sec

unused devices: <none>

Eine halbe Stunde später sollte dann, wenn alles gut geht, das RAID5 wieder redundant und damit fault-tolerant sein.

{ 2 } Comments

  1. Matthias | 15. April 2007 at 23:10 | Permalink

    ... und nächste Woche sehen sie bei "Backen mit Meckel" einen leckeren BIOS-Kuchen! :P

  2. koenig | 16. April 2007 at 17:20 | Permalink

    Umständlich! ;) Aber solange die Daten noch da sind...