Onsite- und Offsite-Backup mit Amazon S3, Jungledisk und alten Festplatten

Nachdem ich mir nun lange genug immer wieder Gedanken um die Sicherheit und die Sicherung unserer Daten gemacht habe war es nun höchste Zeit, dass endlich mal wirklich etwas passiert. Der anstehende Umzug war der Auslöser dafür. Schließlich will man beim bewegen der Rechner und Festplatten kein unnötiges Risiko eines Datenverlusts eingehen. Nachdem ich in der Vergangenheit bereits einige mögliche Lösungen genauer unter die Lupe genommen habe war von Anfang an klar, dass es zwei Wege geben wird wie hier in Zukunft die Daten gesichert werden.

Diese zwei Wege teilen sich wie folgt:

  • Priorität 1: Extrem wichtige, vorwiegend geschäftliche Daten werden über einen Onlinebackup-Speicher gesichert. Das gewährleistet über den Schutz vor Festplattenschäden oder anderweitigem Datenverlust hinaus auch Sicherheit bei z.B. einem Wohnungsbrand oder ähnlichen schwerwiegenden Problemen. Im Vergleich zu anderen Methoden ist Onlinebackup aber aufwändig (verhältnismäßig langsamer Upload) und kostenintensiv (laufende Kosten)
  • Priorität 2: Weniger wichtige bzw. extrem große/viele Daten werden lokal auf Festplatten archiviert/gesichert. Einmalige Anschaffungskosten und hohe Sicherungsgeschwindigkeit machen diese Lösung attraktiv.

Für Priorität 1 sind zirka 5GB Daten zu sichern. Die werden als Spiegelung eines Network shares über JungleDisk bei Amazon S3 (Simple Storage Solution) angelegt. JungleDisk ist ein hervorragendes Tool, das für Linux, OSX und Windows zur Verfügung steht und unabhängig von der Anzahl der Installationen nur $20 USD kostet. Es ist in der Lage lokale Verzeichnisse oder Netzwerkfreigaben in vorgebenen Abständen zu scannen und geänderte bzw. hinzugefügte Dateien hochzuladen. Die Kosten für den Backupspeicher bzw. Transfer sind bei Amazon recht günstig. Pro Monat werden sie inklusive Transfer in absehbarer Zeit nicht über $5 USD steigen. Da ich die Daten nicht ständig sondern nur im Notfall verfügbar haben muss stören mich die teilweise etwas längeren Ausfälle nicht, die in letzter Zeit schon passiert sind.

Für Priorität 2 sind deutlich mehr Daten zu sichern. Durch TV-Aufzeichnungen, Musik und Digitalkamera-Bilder kommen insgesamt mehrere hundert GB zusammen. Das macht eine Online-Lösung derzeit wenig sinnvoll. In Zukunft mag sich das durch steigende Bandbreiten und sinkende Preise eventuell ändern. Für den Moment bin ich dazu übergegangen alte Festplatten zu nutzen um diese Daten gezielt zu archivieren (z.B. TV-Aufzeichnungen nach Serien, Musik nach Interpreten). Die Daten aus Priorität 1 werden zusätzlich auf die Festplatten kopiert um im Notfall schnell Daten zur Verfügung zu haben. In Zukunft wird vermutlich ein kleines 1TB-NAS mit nur einer Festplatte diese Daten im Netzwerk zur Verfügung stellen. Zur Sicherung gegen einen Festplattenschaden wird vielleicht mittelfristig eine zweite Platte das ganze 1:1 spiegeln. Ich bin jedoch derzeit noch nicht sicher ob das überhaupt nötig ist, solange die Daten regelmässig archiviert werden. Die derzeitigen Festplattenpreise (ab 0,10€/GB) sollten jedoch auch hier kein wirkliches Problem darstellen. Das zum Einsatz kommende NAS wird voraussichtlich ein Synology DS107+ sein. Daran lässt sich für Backups eine zusätzliche USB-Platte anschließen. Ob ich davon gebrauch mache, weiss ich aber noch nicht.

Mit dem NAS steige ich übrigens von einer 4-Platten-Raid-5-Lösung auf eine SingleDisk-Lösung um. Der Grund dafür ist ganz einfach: Energie sparen und Lärm dämmen. Die bisher hier tätige Buffalo TeraStation ist laut und frisst eine Menge Energie um auf 4 Platten verteilt 750GB zur Verfügung zu stellen (von der übertriebenen Abwärme des Netzteils mal abgesehen). Im neuen Büro sind wir dann froh diesen Lärm nicht mehr zu haben und deutlich weniger Energie zu verbrauchen. Für die für uns nötige Sicherheitsanforderung ist die oben stehende Lösung zudem die weitaus bessere.

Kommentare

21 Antworten zu „Onsite- und Offsite-Backup mit Amazon S3, Jungledisk und alten Festplatten“

  1. Avatar von Usul
    Usul

    Wegen der Daten von Priorität 1: Schon mal in Betracht gezogen, diese Daten auf ein herkömmliches Medium (DVD) zu kopieren und dann außerhalb des Schuttkegels, bei Freunden, Verwandten oder sonstwem halbwegs vertrauenswürdigem zu lagern? Mit Verschlüsselung sollte es auch kein Vertraulichkeitsproblem geben.

  2. Avatar von Frank Helmschrott

    ja, habe ich – werde ich evtl. auch zusätzlich in größeren Abständen machen. Evtl. auch mit einer Festplatte statt DVD. Das lässt sich dann direkt mit Daten aus Prio2 kombinieren.

  3. […] Frank Helmschrott siniert über seine Backup-Strategie und gibt wertvolle Tipps, Christoph ist ein armer Kerl und bei imgriff.com entwickelt Dominik Tschopp Strategien gegen den Datenverlust. […]

  4. Avatar von alex

    hast du schon mal überlegt, das MobileMe von apple zu nutzen?
    Ich persönlich mache alles über Festplatten, geschäftlich und privat mit TimeMaschine. Festplatten sind halt günstig und die schnellste Möglichkeit auf Dateien chronologisch zuzugreifen ist meiner Meinung nach TimeMaschine. Ok, wenn man utopisch viele Daten hat wie z. B. ein Fotograf, dann wirds mit Backup eh krass, aber als Hobbysnapshooter geht das ohne Probleme..

    schönen Gruß – alex

  5. Avatar von alex

    ach ja, http://www.apple.com/de/mobileme/

    ps: gehts nicht, nen zweiten Kommentar in kurzer Zeit zu hinterlassen?

  6. Avatar von Frank Helmschrott

    Ich nutze MobileMe, allerdings ist die iDisk für mich keine wirkliche alternative. Die Gründe dafür werde ich mal in einem eigenen Beitrag über S3 bzw. die JungleDisk niederschreiben.

  7. Avatar von Ronny

    Hi Frank,

    ich hatte die Cube Station CS407e von Synology auch mal hier. Nachdem ich ca. 7 Tage vergeblich versucht habe das Ding vernünftig zum Laufen zu bekommen, habe ich es zum Shop wieder zurückgeschickt. Ende vom Lied war, dass ich die Synology Geschichte für Schrott befunden habe und ca. 100 Euro „Verschleißkosten“ (20% Abnutzungskosten oder so) an den Onlineshop bezahlt habe. Ich rate dir von dem Ding jedenfalls ab.

  8. Avatar von Frank Helmschrott

    Was heisst denn „vernünftig zum laufen zu bekommen“? Abgesehen davon dass die Cube und Disk-Station wohl recht unterschiedlich sind hab ich bisher fast ausnahmslos gutes darüber gelesen und ich hab‘ mich in den letzten Tagen und Wochen eigentlich recht ausgiebig mit dem Thema auseinander gesetzt.

  9. Avatar von Ronny

    Ich habe versucht ein Raid 1 mit 2 Platten hinzubekommen. Leider hat das nicht geklappt. Die Einrichtung hat dann immer abgebrochen. Ein Datentransfer von mehreren Hundert MB brach aber auch ohne Raid ab… Naja… Ich habe auch in div. Foren dann dort nachgeschaut irgendwelche Patches eingespielt – ein hin und her. Es funktionierte jedoch nie richtig.

    Mag sein, dass ich ein defektes Gerät hatte, aber ich nehme lieber Abstand von Synology – ich würde jetzt wohl in richtig Buffalo Terrastation oder so tendieren. Wobei ich eigentlich die Sachen nicht brauche, da ich meine Platten nun via USB am Server hängen habe und mir mein eigenes NAS gebastelt habe.

  10. Avatar von Ronny

    Achso… vom Support habe ich bis heute glaub ich keine Antwort bekommen :) Das dürfte nun 1 Jahr her sein… :D

  11. Avatar von Frank Helmschrott

    Wenn Du eine TeraStation willst brauchst dich nur melden – meine wird wohl bald hinfällig (eine Pro I mit 4x250GB S-ATA)

  12. Avatar von Erik

    Nenn mich altmodisch, aber ein RAID durch eine einzelne Platte ablösen? Mich würde der Gedanke nervös machen, dass das Überleben meiner Daten von einer einzigen Festplatte abhängt.
    In den ca. 20 Jahren die ich im IT-Sektor unterwegs bin, habe ich zwar auch schon 2 RAID-5 mit eigenen Augen sterben sehen, aber ein RAID minimiert das Risiko doch etwas mehr, oder? Die Geschichte mit der USB-Festplatte solltest Du IMHO auf jeden Fall in Betracht ziehen.

    Nur so ein Gedanke. ;)

  13. Avatar von Frank Helmschrott

    Wenn Du den Artikel und die Kommentare gelesen hast ist Dir ja sicher aufgefallen, dass mir der Unterschied durchaus klar ist. Letztlich gehts mir aber nicht darum ein möglichst hochsicheres und gegen alle Eventualitäten geschütztes System zu betreiben sondern grundlegend das System so zu überdenken, dass es nach allen Aspekten möglichst ideal ist. Im Moment läuft gerade das zweite von 3 GB zu Amazon S3, Änderungen (maximal ein paar MB pro Tag) werden dann wenn sie passieren übertragen. Damit sind die wirklich wichtigen Daten sicherer als sie mit einem Raid-5 je sein könnten.

    Alles andere reicht als gelegentliche Replikation völlig. 24-Stunden am Tag mehrere Festplatten zu betreiben wäre dafür einfach Perlen vor die Säue.

  14. Avatar von Matti
    Matti

    Ich empfehle ja jedem der mich fragt wie ich meine Daten sichere einfach mal bei einem Angebot im Saturn / Mediamarkt ein paar externe USB Festplatten zu kaufen. Da gibts die 500 MB Platten ja teilwiese fast für 50 Euro. Ich selber habe mir vor einer Weile schon 4 Stück zugelegt und habe mit meinen 2 Terrabye erstmal ruhe mit den Platzproblemen :)

  15. Avatar von Erik

    @Frank: Ich hatte nicht vor Dich zu beleidigen. Ich kann Deine Argumentation, was die Platten betrifft, durchaus nachvollziehen. Vor allem die S3-Geschichte trifft voll meinen Geschmack: Jemand anderes muss sich um die Verfügbarkeit kümmern. ;)

    Ich bin selbst gerade dabei, meine Strategie bezüglich der Backups zu überdenken; nur zu dem Schritt alles einer Platte anzuvertrauen, bin ich vermutlich noch nicht bereit. (Ich schiele momentan, beeinflusst durch Leo Laporte und Konsorte, auf ein Drobo.)

    Wäre schön, wenn Du über Deine Erfahrungen mit der neuen Konfiguration berichten würdest.

  16. Avatar von Frank Helmschrott

    Keine Sorge, als Beleidigung habe ich das nicht aufgefasst. Grundsätzlich hast Du natürlich Recht, dass mit einer Platte im Vergleich zu einem Raid-5 (alles darunter kann man IMHO knicken) die SIcherheits erstmal deutlich niedriger ist.

    Es gilt eben abzuwägen welche Sicherheitsstufe man wirklich braucht. Meine Gedanken gehen immer mehr in Richtung Minimalisierung (Reduzierung auf das nötigste) und da ist der Betrieb der TeraStation mit 4 Platten, dem damit verbundenen Lärm (ok ist erträglich aber eben vorhanden) und der Stromverbrauch eben ein Dorn im Auge.

    Wie genau die regelmässige Replikation dieser einen Platte aussehen wird, muss sich noch zeigen. Da will ich mir erstmal die genauen Möglichkeiten der Synology-Software anschauen. Angeblich ist das Backup auf mehrere Ziele möglich – denkbar wäre dann entweder ein zweites Gerät das einfach nur Nachts spiegelt oder eben eine USB-Platte. Wichtig ist mir dabei, dass sich eine Lösung findet die die zweite Platte möglichst automatisch nur dann in Betrieb nimmt wenn das Backup läuft. Sonst wäre der Einspareffekt komplett für die Katz.

    Ich habe heute morgen eine Mail von Cyberport bekommen. NAS und Festplatte sind auf dem Weg. Mal sehen.

  17. Synology DS107+ eingetroffen – ein erster Eindruck (Network Attached Storage – NAS) » Frank Helmschrott

    […] Nebenstehendes Gerät – eine Synology DiskStation 107+ – ist heute samt Festplatte hier eingetroffen. Damit beginnt der nächste Schritt in Sachen OnSite- und OffSite-Backup. […]

  18. Avatar von René
    René

    Frage: Wieviel Strom zieht den das Buffalo-Gerät aktuell?

    Ich persönlich hätte auch ein ungutes Gefühl, was die Single-Disk betrifft. Ein RAID-1 auf 2 Platten sollte es schon sein. Dafür liefert Synology das passende Gerät (Diskstation DS-207+).

    Okay, Du hast nen RAID-1 sozusagen verteilt gelöst, vorausgesetzt, es werden wirklich alle relevanten Daten sofort nach Änderung oder Hinzufügen extern gespeichert. Aber auch hier bereitet mir der Gedanke, von meiner Internetverbindung abhängig zu sein, Unbehagen. Wenn ich überlege, was ich momentan an Kundendaten (Kontakte, Angebote, Rechnungen) und Projektdaten pro Tag produziere (3 Leute), kommt da schon ne Menge zusammen. Falls dann Murphy zuschlägt und die Platte abraucht + Internet nicht geht, steht erstmal der Betrieb. Sowas kann schon mal nen Auftrag kosten.

    Zwei Synology-Geräte zu verwenden, spricht dann irgendwie wieder gegen das Argument des Stromsparens. Der Verbrauch ist wahrscheinlich immer noch geringer als die aktuelle Lösung. Aber warum 2 Geräte, wenn es auch mit einem gelöst werden kann?

    Ein wenig Bauchschmerzen habe ich auch bei dem Gedanken daran, Geschäftsdaten auf einem externen Server zu speichern. Belanglose private Daten okay, aber geschäftliche, hmmm. Erstens weiß ich nicht, ob meine Kunden damit einverstanden wären. Denn man besitzt u.U. Daten für die man versichert hat, diese keinem Dritten zur Verfügung zu stellen. Und zweitens geht Amazon prinzipiell den gleichen Weg wir Google: Daten sammeln und auswerten (natürlich nur für eigene Zwecke). Die Frage wäre: In welcher Art und Weise sind die Daten bei Amazon S3 geschützt (vor Diebstahl, vor Zerstörung usw.)? Werden die Daten dort individuell verschlüsselt abgelegt? Mal abgesehen davon, dass Amazon einen guten Job tun wird. Was spricht dagegen, die Daten als Backup auf dem eigenen Webserver abzulegen? 5 GB Plattenplatz ist nicht so umfangreich. Und zusätzliche Kosten fallen auch nicht an.

    Meine aktuelle Lösung (Debian-Server) erledigt genau das, was das NAS machen würde (RAID-1, Fileserver, Webserver, UPnP-Server, iTunes-Server, Backups) und noch viel mehr (Subversion, LDAP, IMAP, VPN). Demnächst werden die Festplatten gegen stromsparende Modelle ausgetauscht. Dazu war mal vor ner Weile in der c’t ein guter Artikel. Ich glaube von Western Digital gibt es sehr gute, stromsparende 1-TB-Modelle. Das ganze steckt in einem Barebone mit stromsparender CPU. Da ich den Grafikchip nicht benötige, wird der abgeschaltet. Und eventuell wird noch das Netzteil gedrosselt.

  19. Avatar von Frank Helmschrott

    Ja, ich habe mich gegen eine Raid-Lösung entschieden. Ich hatte ja schließlich schon eine hier und daher war es aus diversen Gründen wirklich eine Richtungsänderung und nicht nur eine bloße Entscheidung beim Neukauf.

    Natürlich ist mir der Unterschied in der Datensicherheit bekannt – ich kenne die Vor- aber auch die Nachteile von Raid-Lösungen und es würde mir schlechtweg gar nichts bringen. Warum? Die maximale Ausfallzeit bzw. die maximal ausgefallene Arbeit bei wichtigen Daten liegt bei einer Stunde. Das ist verschmerzbar. Bei den unwichtigen Daten liegt sich im Endausbau bei einem Tag – das ist auch verschmerzbar. Bezüglich Kundendaten kannst Du auch davon ausgehen, dass ich da eine Lösung habe die den Verträgen mit Kunden entspricht – sonst würde ich das nicht machen. Welche Sicherheitsstufe Du benötigst weiß ich nicht, aber diverse S3-Clients bieten die Möglichkeit Daten beim hochladen zu verschlüsseln – das gleiche kannst Du aber natürlich auch selbst machen bevor Du die Daten hoch lädst. Oder halt eben gar nicht erst hochladen. Das muss jeder selbst entscheiden. Mir wars einfach wichtig ein Offsite-Backup zu haben um nicht bei einem Brand oder ähnlichem größeren Unglück völlig blank bzw. mit veralteten Daten hierzustehen.

    Ein Raid-1 ist zwar nett, wenn man kürzere Ausfallzeiten nicht in Kauf nehmen kann oder einfach sekündliche alle Daten „safe“ haben muss gegen einen Hardwareschaden, bringt aber halt leider nicht viel, wenn mehr schief läuft. Nicht selten haben billige Raidcontroller oder Softwarelösungen schon defekte Dateien geschrieben – dann ist alles im Eimer – aber dafür synchron auf beiden Platten ;-)

    Durch S3 habe ich mehrere Versionen von jeder (auch von gelöschten) Dateien. Das gibt mir die Möglichkeit auch eine defekte PSD-Datei oder ähnliches wiederherstelle zu können und ist mir viel mehr Wert als die vermeindliche Sicherheit von Raid-1. Und ja, der eigenen Server täte es auch, die Ausfallsicherheit ist da allerdings nicht so groß und Versionierungseinrichtungen etc sind ziemlich aufwändig zu administrieren – ich hab ja schon genug Arbeit und will mir nicht noch selbst welche machen ;-)

    zum Raid: Wenn Raid (für diesen Zweck) dann zumindest Raid-5 mit einer Spare/HotSpare. Sonst macht das alles keinen Sinn. Und das wiederum ist Ökologisch unterm Strich unrentabel für meine Zwecke.

    Den eigenen Bedarf kennt natürlich jeder selbst am besten und so bin ich sicher, dass Du Dir für Deine Lösung auch die nötigen Gedanken gemacht hast.

    P.S. Den Backup-Weg über die zweite Synology werde ich vermutlich wählen – die wird dann des Nächtens hochgefahren, Backup gefahren, wieder runtergefahren. Geht glücklicherweise mit der Bordeigenen Software perfekt – die TeraStation bietet diese Möglichkeit leider nicht – sonst hätte ich sie wohl behalten und als Backupmedium genutzt. Wie’s aussieht werde ich sie wohl verkaufen.

  20. Avatar von René
    René

    Das mit der „maximalen“ Ausfallzeit ist natürlich so eine Sache. Auch wenn Amazon S3 astrein und zuverlässig läuft, ist die Internet-Verbindung dazwischen, die Zicken machen kann. Und da spielen mehrere Faktoren eine Rolle. Ich habe schon mal einen Ausfall von 3 Tagen gehabt, ohne dass mein DSL- bzw. Internet-Provider daran Schuld waren. Okay, die haben auch mal Ausfälle von 1 – 2 Tagen verursacht, aber das war gerade noch so zu verschmerzen. Der „Langzeitausfall“ wurde durch Bauarbeiten und ein damit verbundenes, defektes Kabel und eine defekte Vermittlungsbox verursacht. Okay, das kam bisher nur einmal vor. Aber immerhin. Natürlich ist es auch unwahrscheinlich, dass gerade dann die NAS-Platte abraucht. Aber ehrlich gesagt: Ich habe schon Pferde vor der Apotheke usw. Naja, vielleicht bin ich auch nur nen „Warmduscher“ und seh das alles zu eng. Ich drück Dir mit Deinem Setup auf jeden Fall die Daumen. Du hast das ja sehr genau recherchiert und konzipiert. *daumendrück*

  21. Synology Disk Station – meine Speicher- und Backup-Lösung » Frank Helmschrott

    […] paar Tage ist es bereits her, als ich darüber geschrieben habe, dass ich meine Speicher- und Backupstrategie hier etwas überarbeiten wollte. Im August habe ich dann ebenfalls berichtet, dass die Synology […]

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.