Codebalancer

Webdevelopment, symfony, PHP, SEO, Gadgets, Frameworks, Projekte, Performance, Off-Topic, Berlin, Bücher, Links, Technologie

»Data rot« (Datenfäule) oder: die exponentielle Datenverwesung (updated) 31.03.2009

Ich war gerade etwas überrascht, keine etablierte Übersetzung des Begriffs »data rot« zu finden, was ich hier dann mal mit Daten-Fäule oder Daten-Verwesung selbst festhalten würde.
Datenverwesung ist ein Thema, das uns wohl in den nächsten Jahrzehnten zunehmend beschäftigen wird, wenn wir nicht in die Geschichte als »das große schwarze Loch« eingehen wollen.

Der fortschreitende Grad der Digitalisierung von verschiedenen Medien und der flächendeckende Einzug von ordentlich schnellen Computern hat schon seine Vorteile:
Nie war es einfacher eine so große Zahl von Medien (E-Mail, Dokumente, Fotos, Musik, Filme) zu Hause zu verwalten, und das ohne, dass man großartig als Freak gelten würde, weil man seinen Keller, Dachboden und Schlafzimmer voller Regale mit irgendwelchen Kisten und Kram hätte.

Der fortschreitende Grad der Digitalisierung von verschiedenen Medien und der flächendeckende Einzug von ordentlich schnellen Computern hat schon seine Nachteile:
Es wird mehr. Es gibt immer immer mehr Daten; undzwar nicht nur, durch die längere Nutzung bedingt, sondern auch durch den noch immer steigenden Grad der Digitalisierung und dessen Qualität.
MP3s unter 192 kbit/s kommen mir garnicht mehr in die Tüte; selbst billigste Digi-Knipsen haben 8 oder mehr Megapixel (wenn auch verschwommen), HD-Camcorder sind inzwischen keine Prestige-Objekte mehr.
All das verursacht Mega-, Giga-, und Terrabytes in jedem Haushalt, die auch wenn ihre Bits nicht einfach umfallen, nicht endlos lange nutzbar sind.

Schon alleine, um dem wachsenden Datenwust Herr zu werden, muss alle paar Jahre ein neuer Computer, oder zumindest weitere Festplatten her.
Regelmäßiges, Extremdatenausmisten? Schöne Idee. Aber löschen tut weh – »könnte man vielleicht nochmal gebrauchen«. Wir sind Datenmessies.
Wäre man naiv, würde man meinen, dass der ständig und exponentiell steigende Platz ja irgendwann wohl mal genug wäre, die Rechner schnell genug, und die Solid-State-Platten länger hielten als ihre Pendants mit mechanischen Bauteilen aka Sollbruchstelle.
Spätestens 6 Monate nach Auspacken des neuen Rechners verschwindet der Gedanke wieder. Schonwieder alles so voll und langsam hier.

Chaos der Formate und Datenträger

Seitdem wir uns vom Nachfahren des Papyrus abgewandt haben, haben wir einen ständigen Wettlauf nach einem noch besseren, schnelleren Speichermedium mit höherer Kapazität gestartet.
Von der Schallplatte zur MP3 gab es so einige komplett inkompatible Zwischenschritte.
Aber selbst die Volldigitalisierung ist nur ein weiterer Zwischenzustand mit unendlicher Fragmentierung.
Disketten kann heute kein neuer Computer mehr lesen – will ja auch keiner – aber man braucht auch garnicht so »weit zurück« blicken. Ein 64-in-eins-Kartenleser spricht eine deutliche Sprache:
Die Rettung der Daten hängt von ständiger Eigeninitative und der Wahl des »richtigen« Speichermediums ab.
Teilweise auch vom Codec, einer bestimmten Software, Dateiformat, Betriebssystem, Dateisystem (alles natürlich in verschiedenen, meist nicht komplett Rückwärtskompatiblen Versionen) oder auch der Hoffnung, dass der Verkäufer oder DRM-Händler in den nächsten Jahrzehnten doch bitte nicht pleite gehe, bzw. seine Server abstelle.
Die nächste Neuinstallation käme ansonsten einem digitalen Wohnungsbrand gleich.

Bezeichnend schon, dass man sich an dieser Stelle freuen müsste, dass es mit USB zumindest für die meisten Geräte eine größtenteils unterstüzte Schnittstelle gibt, und das schon seit über 10 Jahren.
10 Jahre. Wahnsinn.
Wenn meine Kinder mich mal nach meinem 1,2er Abi-Zeugnis fragen, kann ich sagen: Hab ich leider vergessen ins neue Format zu konvertieren (bzw. auf aktuellen Datenträger), aber müsst ihr mir glauben!

Cloud Storage

Eine Alternative zur unendlichen Daueraufrüstung wollen »Cloud-Storages« wie z.B. ZumoDrive darstellen. Anstatt auf lokalen Laufwerken legt man seine Dateien über's Internet auf deren Servern, der sog. »Cloud« ab, wobei das möglichst gut ins Betriebssystem integriert sein sollte.
Der Haken, ganz klar: Die Geschwindigkeit. Solange wir nicht alle unsere Gigabit-Leitungen haben.
Für ein paar Word oder PDF-Dateien sicherlich schon heute eine brauchbare Lösung, und ich würde sowas jedem Diplomarbeitsschreiber ans Herz legen, denn zumindest der Diebstahl oder Verlust des Rechners geht nicht mehr mit einem kompletten Datenverlust einher.
Gleichzeitig bieten solche Dienste den Zugriff von verschiedenen Rechnern auf stets synchronisierte Daten, was ein sehr netter Nebeneffekt ist.

Noch ein Haken: 50 GB Online-Speicherplatz kosten $12 (~ 8,90€), 500 GB kosten $80 (~ 60€) monatlich, was etwa dem Preis einer externen 500 GB Festplatte entspricht.
Das mag ebenfalls für ein paar Office-Dokumente reichen, aber mir persönlich wäre das erstens zu wenig Speicherplatz, und zweitens deutlich zu teuer.
Selbst meine Onkel und Tante, die ich jetzt nicht als Power-User bezeichnen würde, haben rund 50 GB Daten (Tendenz steigend), die jetzt nicht unbeding verschinden sollten.

Echtzeitverwesung

Eine ganz andere Qualität des Verfalls, quasi in Echtzeit, stellen heute Webseiten dar, die hochdynamische Inhalte liefern: i.d.R. Nachrichtenseiten, Foren, Blogs, Social-Networks.
Diese werden ständig aktualisiert und ergänzt, bis sie irgendwann gerelauncht oder eingestampft werden. Eine nützliche Information, die heute noch zugänglich ist, ist in einem halben Jahr vielleicht nicht mehr da.
Internetseiten, die auf aktuelle (oder veraltete) Browser optimiert sind, werden in 10 Jahren vielleicht ganz anders gerendert.
Was zeigen ausgezeichnete Journalisten in ein paar Jahren ihren Kindern, womit sie früher mal ihren Lebensunterhalt verdient haben? »Ich hatte mal so ein Interview mit Obama gemacht, ist leider mehr online.«

Einen Ansatz das sich ständig ändernde World Wide Web festzuhalten hat das Web Archive, das Webseiten besucht und samt Assets für die Nachwelt speichert.
Dass dieses »Internet in a Box« niemals annähernd komplett sein kann – schon allein, weil nicht jede Seite gut verlinkt ist, und damit gefunden werden kann – dürfte klar sein.
Aber was soll man sonst machen?

Zwangsarchivierung von Amts wegen

Die Deutsche Nationalbibliothek will eine Antwort wissen: Per Gesetz verpflichtet sie jeden Webseitenbetreiber seine Webseiten ins Archiv abzugeben.
Ob der Zugang an eine Mitgliedschaft gebunden, oder passwortgeschütz ist, spielt keine Rolle.
Das Argument: Bücher kosten auch Geld, in der Bibliothek kann man sich diese kostenlos anschauen.

Fazit:
Wer jemals einen Computer anfässt, unterschreibt quasi in Blut, dass er in guten wie in schlechten Zeiten die Industrie unterstützen, ihr immer neue Hard- und Software abnehmen werde, so wahr ihm Gott helfe, damit ihm seine liebgewonnenen Bits und Bytes auch in Zukunft treu bleiben, denn diese vergammeln schneller als Ur-Omas schwarz-weiß-Fotos.
Das Internet gibt es nicht in Tüten. Noch nicht.

Kommentare

Claudius Raphael Paeth sagt: 23.05.2012

Ein wundervoller Abriss ...

über den ich hier gestolpert bin. Und ich stimme voll und ganz zu. Doch zur Läutseligkeit des Unterfangens die eigenen Daten am Leben zu halten möchte ich etwas beisteuern; So habe ich vor einiger Zeit, die leidliche Erfahrung machen müssen, dass beim Versuch, all meine Daten auf größere Datenträger zusammenzufassen nicht nur der Plattenplatz angeblich nicht ausreichen würde, nein, die Platte an sich wäre nicht geeignet, da mir in diesem Fall Windows 7 weismachen wollte, ich dürfe lediglich eine mindestens 5.200 UPM Platte mit 8MB Cache nehmen, insofern ich den vorhabe meine Daten zu erhalten. Andernfalls müsse ich auf eigenes Risiko fortfahren. Was ich tat. Ergebnis: Die Daten wurden nicht kopiert, stattdessen ausgeschnitten und in ein Nirvana aus sich wiederholenden Kopiervorgängen geschickt.

Nun denkt man womöglich, wenn man weiß welchen Bezug ich zu Computern im Allgemeinen und Besonderen habe und aufgrund der Tatsache dass die Anzahl persönlich zusammengestellter und eingerichteter PC's samt Anpassung der zur Verwendung gewünschten BetriebSysteme und sonstiger Applikationen längst vierstellig ist; ja, wenn man das berücksichtigt, würde man mir womöglich unterstellen eine simple Datensicherung sei doch kein Problem.

Dachte ich auch.

Dem ist nicht so.

Ich habe die Konseqeunz gezogen und bin nach etwas mehr als 10 Jahren zurückgekehrt zu freier Software, wie ich sie noch aus Public-Domain Zeiten am Commodore 64 kannte, bzw. zu FOSS/OpenSource, etc.; Diese Entscheidung basiert schlicht und ergreifend auf der Tatsache, dass diese CODEC's, APP's und OS's zwar ebenfalls krampfhaft versuchen sich selbst zu überholen, doch weiß ich bei einer OGG-Vorbis Codierung zumindest dass ich sie auf jedem System in jedes x-beliebige Format wandeln kann und dank Theora, habe ich durchaus eine Archivierungsmöglichkeit für Videos, auch wenn das Umwandeln eines mit dem Handy aufgenommenen Videos in Theora, zunächst schwachsinnig erscheinen mag. Nur durch diese Mühe die ich mir nun seit rund 3 Jahren mache, habe ich noch tatsächlich funktionierende Archiv-Aufnahmen.

Doch genug der Quacksalberei, spannender wird es nicht ...

P.s.: Eine kleine Anregung für den Einzelnen der nach der Lösung sucht:

1. Schritt: Rippe alles was du auf optischen Medien hast.
2. Schritt: Baue deinen Brenner aus und verzichte in Zukunft auf optische Medien am PC.
3. Schritt: Verweigere den Kauf einer Zeitschrift wenn sie optische Medien enthält; Ausnahme: Du schaust dir den beiliegenden Film wirklich nur auf dem DVD-Player an.
4. Schritt: Streiche die Existenz optischer Medien. Willst du etwas archivieren, kaufe eine Festplatte, achiviere sie schwingend gelagert in einem Blei-Mantel und sorge dafür dass sie auf immer und ewig neben den Daten ausgestattet ist mit der Software und den Betriebssystemen die du gerade verwendest.

ODER:

Nutze: 32GB micro-SDHC in FAT32 formatiert schiebe deine Daten da drauf, nachdem du alles in freie und quelloffene Formate konvertiert hast. Viel Spaß die nächsten 5 Jahre.

ODER:

Vergiss das alles, kommentiere meinen Kommentar mit: Was will uns der Vogel eigentlich erzählen? backe dir eine Pizza und genieße sie während du deine Festplatten formatierst und deine Backup-Rohlinge in der Resthitze des Ofens vermanscht.

ABER:

Mein lieber Autor:

... Es kommt drauf an wie man die Tüten baut! Dann gibt's auch Internet direkt in den Kopf! Viel Spaß, schönen Schrank und ich schau mal kurz in'n Garten, hab da was grünes gerochen ...

Kommentar hinzufügen

Der Inhalt dieses Feldes wird nicht öffentlich zugänglich angezeigt.
  • Internet- und E-Mail-Adressen werden automatisch umgewandelt.
  • Erlaubte HTML-Tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Zeilen und Absätze werden automatisch erzeugt.

Weitere Informationen über Formatierungsoptionen