The roads I take...

KaiRo's weBlog

November 2024
123
45678910
11121314151617
18192021222324
252627282930

Zeige die letzten Beiträge auf Deutsch und mit "Ausfall" gekennzeichnet an. Zurück zu allen aktuellen Beiträgen

Populäre Tags: Mozilla, SeaMonkey, L10n, Status, Firefox

Verwendete Sprachen: Deutsch, Englisch

Archiv:

Juli 2023

Februar 2022

März 2021

weitere...

6. Juli 2009

Persönlicher Server nach Ausfall hoffentlich gerettet

Wenn ihr euch wundert, warum mein Blog, SeaMonkey deutsch, Find Your NetFriends, andere Communities auf unserem System, www.kairo.at, CBSM oder jegliche andere der Webseiten auf unserem Server für den Großteil des vergangenen Tages nicht verfügbar waren, hier die eine kurze Geschichte dieses toxischen Vorfalls:
  • Der Server hat quasi den Kontakt zu einer Festplatte verloren (sie ist einfach nirgends mehr aufgeschienen),
  • die Software-RAID-5-Treiber unseres System-"Laufwerks" kannten sich nicht damit aus,
  • ich hab ein Kommando erzwungen, um das wieder in Schwung zu bekommen und lief in einen I/O-Fehler (autsch, das heißt meist nichts Gutes),
  • wir schalteten den Server ab, nahmen die Platte raus,
  • gaben sie wieder rein, und sie funktionierte wieder,
  • wir haben das RAID-Array neu erstellt und stellten fest, dass es sein Dateisystem nicht mehr erkannte,
  • das Dateisystem-Reparations-Tool (fsck.ext3) spuckte Millionen von Fehlermeldungen über ungültige Journale und Inodes aus,
  • wir haben es neu formatiert und das ganze System neu installiert,
  • sowie alle wichtigen Daten von Backups wiederhergestellt.
Wie ihr euch wahrscheinlich denken könnt, war im den Tränen nahe, als mir klar wurde, dass unsere geliebte System-Installation zur Gänze flöten gegangen war und ich alles neu aufsetzen konnte. (Nein, unter Linux und besonders bei Servern ist das nicht üblich, das ist KEIN Windows-Heimcomputer.)

Gott sei Dank war ~5-6 Stunden vor dem anfänglichen Systemausfall ein Backup gelaufen, sodass nicht zu viel verloren ging, aber ich brauchte 10-12 Stunden bis zum jetzigen Stand, an dem alles wieder halbwegs in Ordnung zu sein scheint. (Sicherlich werden in den nächsten Tagen noch ein paar Kleinigkeiten auftauchen, aber die hautsächlichen Webseiten scheinen alle OK zu sein, die Mails fließen wieder, usw.)

Wenn ihr mir zwischen 3 und 9 Uhr in der Früh am 5. Juli E-Mails geschickt habt, sind die ziemlich sicher verloren, in anderen Fällen sollten sie angekommen sein oder reinkommen, während das SMTP-Netzwerk mitbekommt, dass unser Server wieder verfügbar ist.

Ich hoffe, die Zeit, die ich dadurch beim Lernen verloren habe, ist nicht zu toxisch für die Prüfung morgen Nachmittag, deren Thema ganz "zufällig" - Toxikologie ist. ;-)

Von KaiRo, um 02:40 | Tags: Ausfall, RAID, Server | 2 Kommentare | TrackBack: 0

Feeds: RSS/Atom