RAID ist kein Backup, sondern eine Methode zur Prävention von Festplattenausfällen. Daten in einem RAID array können trotzdem bearbeitet oder manipuliert werden.
Ein Backup bzw. eine Datensicherung ist die Speicherung von Daten in einem vom Quell-System unabhängigen Speicher. Das Ziel ist, eine Kopie der zu sichernden Daten zu erstellen. Dadurch wird vor Datrenverlust geschützt.
Einige Gründe für ein Datenverlust können z.B. sein:
Die Backup Methode des initialen Backups ist stets ein Full Backup
Manche File Systems (z.B. NTFS mit dem Archivbit) können markieren, ob eine Datei bereits gesichert wurde oder nicht. Sofern mehrere Backupsysteme das Bit ändern, ist diese Information jedoch unzuverlässig. Stattdessen kann man den TImestamp der letzten Änderung der Datei nutzen. Eine weitere Alternative ist es, die Prüfsummen oder die Dateigrößen der Daten zu vergleichen, um Änderungen festzustellen. Wobei die Dateigröße ebenfalls unzuverlässig sein kann.
| Backup Methode | Geschwindigkeit | Speicherverbrauch | Bandbreite | Wiederherstellungsgeschwindigkeit |
|---|---|---|---|---|
| Full Backup | ❌️ langsam | ❌️ viel | ❌️ viel | ✅ schnell |
| Differential | ➖ mittel | ➖ mittel | ➖ mittel | ➖ mittel |
| Incremental | ✅ schnell | ✅ wenig | ✅ wenig | ❌️ langsam |
| Synthetic Full | ➖ mittel | ❌️ viel | ✅ wenig | ✅ schnell |
Ein Backup Medium kann alles sein, was ein File System mit einem Lese- & Schreibzugriff bietet. Das Backup Medium ist dabei das Zielmedium, in der die Datensicherung gespeichert wird.
Gewöhnliche Backup Medien sind:
Man kann das geeignete Backup Medium mit Hilfe folgender Kriterien bestimmen:
Die bekannteste Strategie ist die sogenannte 3-2-1 Backup Strategie:
Dazu gibt es zu dem eine 1-0 Erweiterung:
Bei einem Backup tauchen auch vermehrt Duplikate auf. Duplikate sind hierbei Daten, die bereits gesichert wurden, sodass eine erneute Speicherung selbiger Daten aufgrund der Redundanz zu erhöhtem Speicherverbrauch führen. Mittels Deduplication wird eine erneute Speicherung bereits gedicherter Daten gemieden. Stattdessen wird eine Referenz hinterlegt. Dadurch werden Datenredundanzen und somit auch eine erhöhte Speichernutzung gemieden.
Die Deduplication kann hierbei client-seitig oder auch auf Seiten des Backup-Servers stattfinden. beide haben ihre jeweiligen Vor- und Nachteile. Während eine client-seitige Deduplication zu einer geringeren Auslastung der Datenleitungen führt, erspart eine serverseitige Deduplication eine client-seitig erhöhte CPU- und RAM-Belastung.