Backup

RAID ist kein Backup, sondern eine Methode zur Prävention von Festplattenausfällen. Daten in einem RAID array können trotzdem bearbeitet oder manipuliert werden.

Ein Backup bzw. eine Datensicherung ist die Speicherung von Daten in einem vom Quell-System unabhängigen Speicher. Das Ziel ist, eine Kopie der zu sichernden Daten zu erstellen. Dadurch wird vor Datrenverlust geschützt.

Einige Gründe für ein Datenverlust können z.B. sein:

  • (gewöhnliche) Löschung von Daten
  • Hardwareproblem
  • Manipulation oder Bearbeitung der Daten
  • externe EIngaben, sowie Malware & Ransomware

Backup Methoden

Die Backup Methode des initialen Backups ist stets ein Full Backup

Manche File Systems (z.B. NTFS mit dem Archivbit) können markieren, ob eine Datei bereits gesichert wurde oder nicht. Sofern mehrere Backupsysteme das Bit ändern, ist diese Information jedoch unzuverlässig. Stattdessen kann man den TImestamp der letzten Änderung der Datei nutzen. Eine weitere Alternative ist es, die Prüfsummen oder die Dateigrößen der Daten zu vergleichen, um Änderungen festzustellen. Wobei die Dateigröße ebenfalls unzuverlässig sein kann.

  • Full Backup:
    • Jedes Backup enthält alle Daten
    • Speicherintensiv
  • Differential Backup:
    • Nur die Änderungen seit dem letzten Full Backup werden gesichert
    • Erfordert eine Kombination aus regelmäßigen Full Backups
  • Incremental Backup:
    • Nur die Änderungen seit dem letzten Backup werden gesichert
  • Synthetic Full Backup:
    • Nur die Änderungen seit dem letzten Synthetic Full Backup werden verglichen
    • Im Anschluss wird aus den inkrementell gelieferten Daten sofort ein neues Synthetic Full Backup erzeugt
    • Dadurch wird auch das Client-System entlastet, da die Zusammenführung der Daten auf dem Backup-Server stattfindet
Backup Methode Geschwindigkeit Speicherverbrauch Bandbreite Wiederherstellungsgeschwindigkeit
Full Backup ❌️ langsam ❌️ viel ❌️ viel ✅ schnell
Differential ➖ mittel ➖ mittel ➖ mittel ➖ mittel
Incremental ✅ schnell ✅ wenig ✅ wenig ❌️ langsam
Synthetic Full ➖ mittel ❌️ viel ✅ wenig ✅ schnell

Backup Medien

Ein Backup Medium kann alles sein, was ein File System mit einem Lese- & Schreibzugriff bietet. Das Backup Medium ist dabei das Zielmedium, in der die Datensicherung gespeichert wird.

Beispiele

Gewöhnliche Backup Medien sind:

  • HDD (Festplatte)
  • SSD
  • Tape (Magnetband)
  • Cloudspeicher

Auswahlkriterien

Man kann das geeignete Backup Medium mit Hilfe folgender Kriterien bestimmen:

  • Die Größe der zu sichernden Daten
  • Die Speicherdauer (Retention Time)
  • Lese- & Schreibgeschwindigkeiten (bei Cloud Storage auch die Internetanbindung)
  • Kosten

Backup Strategien

Die bekannteste Strategie ist die sogenannte 3-2-1 Backup Strategie:

  • 3 Kopien der Daten (1x Originale & 2x Kopien)
  • auf 2 verschiedenen Medien
  • davon 1 an einem anderen Standort

Dazu gibt es zu dem eine 1-0 Erweiterung:

  • 1 Kopie offline oder unveränderlich
  • mit 0 Fehlern (automatisierte Backups & Verifizierung der Wiederherstellbarkeit der Daten)

Deduplication

Bei einem Backup tauchen auch vermehrt Duplikate auf. Duplikate sind hierbei Daten, die bereits gesichert wurden, sodass eine erneute Speicherung selbiger Daten aufgrund der Redundanz zu erhöhtem Speicherverbrauch führen. Mittels Deduplication wird eine erneute Speicherung bereits gedicherter Daten gemieden. Stattdessen wird eine Referenz hinterlegt. Dadurch werden Datenredundanzen und somit auch eine erhöhte Speichernutzung gemieden.

Die Deduplication kann hierbei client-seitig oder auch auf Seiten des Backup-Servers stattfinden. beide haben ihre jeweiligen Vor- und Nachteile. Während eine client-seitige Deduplication zu einer geringeren Auslastung der Datenleitungen führt, erspart eine serverseitige Deduplication eine client-seitig erhöhte CPU- und RAM-Belastung.