Thema: Langzeitarchivierung in der Praxis
Nachdem ich die Einleitung zum Thema Langzeitarchivierung soweit fertiggestellt habe, können wir nun zum Praxisteil übergehen. Während der Sichtung der zu diesem Schwerpunkt bereits existierenden Threads fiel mir vor allem auf, daß insbesondere drei Archivierungsmethoden favorisiert werden, welche der Migration und dem Refreshing zugeordnet werden können.
Sehr viele Nutzer sichern ihre Archivinhalte auf DVD. Diese Methode kann mittels DVDisaster unter Benutzung von Pararitätsdaten erweitert werden, was mir mehr als sinnvoll erscheint. Wer DVDisaster nicht verwenden möchte, kann auch QuickPar verwenden, was so ziemlich auf's gleiche hinausläuft, wenn man die Paritätsdaten separat vom verwendeten Medium sichert. Sobald die Anzahl der Datenträger eine bestimmte Grenze überschreitet (geschätzt 100 Stück) dürfte jedoch der Überblick über die Inhalte verloren gehen. Auch sollte man daran denken, daß sich die Zugriffs- und Suchzeiten proportional zur Anzahl der erstellten Datenträger erhöhen. Die Sicherung auf DVD sollte auch nur mit den "passiven" Teilen des Archivs vorgenommen werden.
Verwendet man Wechseldatenträgervon so sind Datenbanken und Versionsverwaltungen nicht mehr zu umgehen, da eine Indizierung der Medien einfach unerläßlich ist, um die gesuchten Inhalte wiederzufinden und deren Version feststellen zu können.
Datenbanken erfassen den Gesamtbestand durch das Indizieren der Einzelmedien. Es lassen sich dann daraus Genreverteilungen und graphische Aufbereitungen, zum Beispiel Künstlerlisten und Reports nach Jahreszahlen sortiert abfragen. Komplexe Abfragen sind ihr spezielles Aufgabengebiet. Sie werden meist bei größeren Sammlungen eingesetzt oder wenn mehrere Medien, Archive, Netzwerke oder Rechner verwaltet werden sollen. Verteilte Sammlungen auf mehreren Rechnern oder portablen Geräten lassen sich mit Ihnen ebenfalls synchroniseren und entsprechende Funktionen sind mittlerweile Standard. Mitunter verfügen sie sogar über Backup-Funktionen.
Ausreichend stabile und performante Datenbank-Lösungen um Abfragen oder Albenlisten zu erstellen sind Foobar2000, MPEG Audio Collection (MAC), Helium und Mp3Tag, die wir weiterempfehlen können. Sie enthalten leistungsfähige Datenbanken, die auch mit mehreren tausend Alben und meiner Erfahrung nach auch bei mehr 100.000 Einzelstücken in ihrer Performance kaum einknicken. Unter Linux bietet sich der Einsatz der SQL-fähigen Prokyon3-Software an. Generell lassen sich mit allen hier vorgestellten Programmen einheitliche und nach einem durchgängigem Namens-Schema sortierte Archive pflegen, abspielen und ausbauen.Weiterhin werden von vielen Nutzern Raid 1-Systeme vorgeschlagen, die als Festplatten-Verbünde eine 100%ige Redundanz aller Daten durch Spiegelung (Mirroring) ermöglichen.
Raid1-Festplattenverbünde werden deshalb bevorzugt, weil das Backup gewissermaßen automatisiert vom System übernommen wird. Es ist in geringerem Maße vom "Faktor Mensch" abhängig. Vorteil des Mirror ist, daß bei Ausfall einer HD die Daten noch unversehrt auf einer weiteren Platte leigen. Der Nachteil dieser Methode besteht vor allem darin, daß, wenn sich alle HD's im gleichen Rechner befinden, die zusätzliche Sicherheit durch eine separat verwahrte HD ausfällt; also alles verloren ist, wenn es zu Überspannungs- oder mechanischen Schäden kommt (wie z.B. durch: "näher interessierte" Kinder, Partner- bzw. Ehekrach, ein undichtes Dach, eine übergelaufene Badewanne oder "umgefallene" Getränke ;) ).
Genereller Nachteil von RAID1 ist, daß wenn durch Nutzerfehler ein Teil der Daten gelöscht oder verändert wird, diese auch auf der zweiten RAID1-HD gelöscht oder verändert werden, entsprechend sorgfältig sollte hier gearbeitet werden. Teilweise ist es sogar empfehlenswert, daß man sich selbst in den Nutzerrechten einschränkt und Software-Tests nur an kopierten Teilbeständen durchführt.Als Variation der Spiegelung werden auch manuelle Verfahren genannt, bei denen die Spiegelung der Datenträger händisch erfolgt. Dies geschieht, indem eine zusätzliche HD in regelmäßigen Abständen in einen Rechner eingehängt und der zu sichernde Inhalt mittels eines Backup- oder Synchronisations-Tools auf das Medium geschrieben wird. Danach erfolgen die Entfernung und die separate Lagerung. (Diese Methode wird oft favorisiert, weil die zusätzliche HD nicht dauerhaft im Rechner verbleibt, weshalb sie einer geringeren Belastung ausgesetzt ist. Die Gefahren der Viren-Infektion oder der Beschädigung durch Überhitzung sind damit auch geringer. Allerdings spielt hier für die Sicherheit die Zuverlässigkeit des "Faktors Mensch" (siehe auch: Murphys Gesetz) eine große Rolle...)
Empfehlenswert ist nach einer Spiegelung oder auch einem teilweisen Übertragen die Daten mittels Checksummen (SFV oder md5) zu verifizieren und auf Vollständigkeit zu überprüfen. Dies kann bereits innerhalb eines Backup-Programms geschehen, wenn solche Funktionen unterstützt werden, oder aber mittels spezieller Programme.
Wenn die Kapazität der HD's erschöpft ist, können die vorhandenen Daten auf die nachfolgende Generation von Festplatten kopiert werden. Erfahrungsgemäß hat diese meist die doppelte Größe. Dann beginnt das Spiel von neuem.
Die gebrauchten Festplatten (mitsamt ihrem Inhalt) sollten verpackt und gelagert werden. Der Gebrauchswert als preiswerte Backup-Medien dürfte meist höher liegen als der des Wiederverkaufswertes.
Für die Lagerung, die am besten an einem kühlen und trockenen Ort erfolgen sollte, eignen sich z.B. antistatische EMVgerechte Folientüten, in die man zusätzlich noch ein Silikat-Beutelchen gibt, welches evtl. vorhandene Feuchtigkeit "aufsaugt".
Der Lebenszyklus von Fetstplatten endet mit Sicherheit an dem Punkt, ab dem es keine Controller mehr im PC gibt, an denen sie betrieben werden können. Die Daten sollten also vor diesem Zeitpunkt auf andere Medien umkopiert werden.
Zusammenfassend bitte ich darum, darauf zu achten, daß die besprochenen Methoden durchaus geeignet sind ein Archiv für ca. 5 Jahre zu sichern. Derzeit liegt die Lebensdauer eines PC bei etwa etwa 2-5 Jahren. Insbesondere die Festplatten-Methode gewährleistet erst einmal die Übernahme der Archivinhalte für den Wechsel von alten auf neue Rechner. Die DVD-Methode hingegen vertraut darauf, daß auch in Zukunft genügend Leselaufwerke zur Verfügung stehen werden und keine Generationswechsel stattfinden, die die Nutzer zum Umbrennen (Refreshing) großer Mengen an Medien zwingen, bzw. darauf, daß zukünftige Laufwerksgenerationen ebenfalls so rückwärtskompatibel sind, wie man es z.B. bisher in Bezug auf die Lesefähigkeit von CD(-R)-Medien kennt. Die Sicherheit dieser Methoden bleibt natürlich auch nur solange gewährleistet, wie die Backups auf ihre Funktionsfähigkeit hin kontrolliert werden. Eine Kombination aller genannten Methoden ist selbstverständlich auch möglich.
Eine Langzeitzugänglichkeit über mehr als 10 Jahre ist m.E. derzeit noch nicht möglich, weil in den Backupzeitraum meist mehrere Rechner-, Programm-, Codec- und Betriebssystemwechsel fallen. Methoden dieses trotzdem zu ermöglichen, gilt es hier auf AudioHQ noch zu entwickeln.
Backup
Für die Datensicherung des Systems von einer Festplatte auf eine zweite Festplatte, oder von Rechner zu Rechner, bieten sich eine Vielzahl von verschiedenen Anwendungen an. Von Vorteil ist es in jedem Falle Software zu benutzen, die automatisch Vollständigkeit und Integrität (zB per Prüfsummen) kontrolliert oder die Partitionen bitweise ausliest und in ein Image schreibt. Um nicht unnötig große Imagedateien für eine Systemsicherung zu produzieren sollte die Systempartion von der Datenpartition getrennt werden und eine Größe von 5-10 Gb nicht überschreiten. Eine Aufteilung in 3 Partionen auf der Sytem-HD ist durchaus üblich. Vorne die Systeminstallation, dahinter die Daten, am Ende mit hohen Laufwerksbuchstaben eine Partion in der die Images untergebracht werden. Es können auch mehrere Festplatten verwendet werden um System und Daten auch physikalisch zu trennen.
Kostenlose professionelle Software wie Partimage oder Acronis Trueimage ist hier in jedem Falle anzuraten, auch um durch den Komfort die Datensicherung nicht unattraktiver und zeitaufwendiger zu machen, damit sie auch in regelmäßigen kurzen Zeitabständen durchgeführt wird.
Verzichtet man auf Komfortfunktionen wie etwa die automatische Verifizierung durch Checksummen, so sollte man in regelmäßigen Abständen diese manuell mittels seperater Programme durch führen.
Geht es nur um das kurzfristige und schnelle Sichern eines Progammverzeichnisses, (unabhängig vom System) zB um ein Update auszutesten, so kann man auch weniger aufwendige Programme einsetzen.
Hier ist mir dieser Tage ein Programm namens AutoCopy bei meinen Tests positiv aufgefallen. Ich denke ich sollte es hier einmal als Ersatz für diverse Kommandozeilen-Programme empfehlen.
Homepage des Autors (Freeware)
Insbesondere seine Einfachheit, die deutschsprachige Oberfläche und das Anlegen mehrerer Versionen eines Backups machen diese Freeware empfehlenswert. Der Einsatzzweck ist bei mir das inkrementielle Backup und das Sichern der Foobar2000 Datenbank. Inkrementiell bedeutet, daß nach der ersten vollständigen Sicherung nur noch die Dateien in weitere Backups wandern, welche sich verändert haben, oder neu hinzugekommen sind.
Das Sichern der Audiodateien geht am komfortabelsten über Software, die das Sychronisieren beherrscht, sodaß nur veränderte und neuhinzugekommene Dateien und Verzeichnisse kopiert oder verschoben werden.
Beispiel: SynchronizeIt
Mit Bordmitteln des XP-Betriebsystems funktioniert das über eine Kommandozeile für inkrementielles Sichern. Sowas existiert in Dutzenden von Abwandlungen seit der DOS-Ära:
xcopy /E /D /K "LW:\Verzeichnis\*.*" "LW:\Backup\*.*"
Der zusätzliche Parameter /H erweitert das ganze um die Fähigkeit System- und versteckte Dateien zu kopieren.
weiterlesen:
Sicherungs-Lösungen, Festplatten vs. CDs/DVDs
CD-Archiv auf Festplatte ?
Sicherung als FLAC auf CD-R oder als Audio-CD
Diskussion: Rettung beschädigter Datenträger
Software zur Archiv-Sicherung ?
Zerstörte bzw. vermischte mp3-Dateien
"Murphy's Gesetze des Backups"
Sicherungs-Lösungen
Flexibles Tagging
Tags und Tagging-Formate
Qualitätsdefinitionen