Was ist RAID (Redundant Array of Independent Disks)?
Das RAID-Konzept erhöht die Ausfallsicherheit von Datenspeichern. Es wurde für klassische HDD-Festplatten entwickelt und wird auch heute noch in Serverumgebungen verwendet. Wie sieht der Aufbau von RAID-Systemen genau aus und welche Unterschiede gibt es hierbei?
RAID: Definition und Historie
Der Begriff „RAID“ wurde erstmals 1988 in Zusammenhang mit der Publikation „A case for redundant arrays of inexpensive disks (RAID)“ von Informatikern der University of California in Berkeley verwendet. In der Arbeit diskutieren die Autoren die Möglichkeit, kostengünstige PC-Festplatten zu einem Verbund zusammenzufassen und als großes logisches Laufwerk zu betreiben, um eine Alternative zu den damals sehr teuren SLED-Festplatten (Single Large Expensive Disks) der Großrechner parat zu haben. Da hierdurch automatisch das Ausfallrisiko steigt, sieht das Konzept zudem die redundante Speicherung der Daten vor.
In den nachfolgenden Jahren wurde RAID standardisiert und zunehmend weiterentwickelt, wobei zunehmend der Einsatz in Serveranwendungen in den Vordergrund rückte. Der Aspekt der Kostenersparnis spielte in der Folge kaum mehr eine Rolle – in erster Linie erfüllte der Verbund nun den Zweck, Festplatten problemlos im laufenden Betrieb auszutauschen. Diese Funktion entspricht auch der mittlerweile gebräuchlichen Aufschlüsselung des RAID-Akronyms: Redundant Array of Independent Disks (dt. „redundante Anordnung unabhängiger Festplatten“). Die RAID-Technik ist auf die Eigenschaften der klassischen HDD-Festplatten zugeschnitten. Moderne SSDs lassen sich zwar ebenfalls bündeln, allerdings büßen sie dabei an Performance und – aufgrund fehlender TRIM-Funktionalität im RAID – an Lebensdauer ein.
Die Rolle von RAIDs in heutigen Serverumgebungen
RAID-Systeme sind auch heute noch als wichtige Bestandteile in Serverumgebungen gefragt. Der wichtigste Aspekt ist dabei die Redundanz der gespeicherten Daten, die in diesem Fall aber nicht mit einem klassischen Backup gleichzusetzen ist. In den Serverstrukturen sollen RAIDs dafür sorgen, dass der Ausfall einer einzelnen Festplatte ohne Konsequenz bleibt, da die darauf enthaltenen Daten auch an anderer Stelle im RAID-Verbund abgelegt sind. Weitere Vorzüge, die sich durch den Einsatz eines RAID-Systems erzielen lassen, sind eine Erhöhung der Speicherkapazität sowie schnellere Lese- und Schreibgeschwindigkeiten beim Zugriff auf den Festplattenspeicher.
Wie genau die einzelnen Speichermedien eines RAID-Systems zusammenwirken und welche Funktion ein Verbund am Ende im Servernetzwerk erfüllen soll, kann ganz unterschiedlich sein. Es gibt jedoch verschiedene standardisierte Setups, die in sogenannten RAID-Leveln definiert werden. Zudem unterscheidet man in Software- und Hardware-RAIDs, abhängig davon, ob das Zusammenwirken des Verbunds software- oder hardwareseitig organisiert wird.
Was ist der Unterschied zwischen Hardware- und Software-RAIDs?
Die Kategorisierung in Hardware- und Software-RAIDs kann schnell einen falschen Eindruck davon vermitteln, was es mit diesen beiden Typen von Festplattenverbunden auf sich hat. Zum Betrieb benötigen nämlich beide Varianten Software – die Begriffe beziehen sich lediglich auf die Art der Implementierung.
Beim Hardware-RAID fällt die Organisation der einzelnen Speichermedien in den Aufgabenbereich einer speziellen, leistungsstarken Hardware, die man auch als RAID-Controller bezeichnet. Dieser Controller wird entweder in das Gehäuse eines Computers oder in ein Disk-Array (dt. „Plattensubsystem“), in dem auch die Festplatten untergebracht sind, eingebaut. Letztere Variante wird in Rechenzentren präferiert, wobei die externen Systeme häufig unter den Bezeichnungen DAS (Direct Attached Storage), SAN oder NAS zum Einsatz kommen. Der große Vorteil einer solchen hardwareseitigen Organisation von RAIDs ist die hervorragende Performance, die sich u. a. in einer hohen Datentransferrate äußert.
In einem Software-RAID wird die Verwaltung des Speicherkontingents von einer Software übernommen, die direkt auf der CPU des Hosts ausgeführt wird. Man spricht aus diesem Grund auch von einem host-based RAID-System (dt. „Host-basiert“). Gängige Betriebssysteme wie Windows (ab NT) oder Linux-Distributionen bringen die hierfür erforderlichen Komponenten mit. Im Vergleich zur Hardware-Alternative ist ein Software-RAID deutlich schneller und preisgünstiger eingerichtet. Nachteile sind die hohe CPU-Auslastung für den Host und die fehlende Plattformunabhängigkeit. Da sich die Plattenzugriffe nicht so elegant regulieren lassen wie mit einem RAID-Controller, fällt zudem die Performance schlechter aus.
Die gängigen RAID-Level im Überblick
Wie erwähnt bezeichnet man die Art, wie Festplatten in einem RAID miteinander kombiniert werden, als „Level“. Die Bezeichnung sorgt jedoch immer wieder für Missverständnisse, denn die verschiedenen möglichen Festplatten-Setups bauen nicht stufenweise aufeinander auf. Die einzelnen Level-Nummern stehen grundsätzlich in keinerlei Verbindung und kennzeichnen lediglich die verschiedenartigen Ansätze für den Aufbau und die spätere Funktion des RAIDs. Zu den gebräuchlichen Leveln zählen insbesondere RAID 0, RAID 1, RAID 5 und RAID 6. Auch Kombinationen aus zwei RAID-Leveln sind möglich. RAID 10 bezeichnet beispielsweise ein RAID-0-System, das aus mehreren RAID-1-Systemen zusammengefügt wurde.
RAID 0: Striping
Festplattenverbunde, die unter dem Label RAID 0 laufen, zählen streng genommen gar nicht zu den RAID-Systemen, da sie bei der Speicherung nicht auf Redundanz setzen. Das Modell dient lediglich dem Zweck, den Zugriff auf die Daten zu beschleunigen, indem zwei oder mehrere Festplatten zu einem logischen Laufwerk zusammengefasst werden. In aufeinanderfolgenden Blöcken werden die Daten hierfür gleichmäßig auf die einzelnen Datenträger verteilt. Im Englischen bezeichnet man diese Blöcke als stripes, weshalb RAID 0 auch als „Striping“ bekannt ist. Während der Verbund für mehr Speicherkapazität und eine höhere Durchsatzrate sorgt, senkt er automatisch auch die Sicherheit: Fällt eine Festplatte aus, sind sämtliche Daten verloren. Mehr zum Striping-Ansatz erfahren Sie in unserem ausführlichen Ratgeber über RAID 0.
RAID 1: Mirroring
RAID-Level 1 wird auch als „Mirroring“, also „Spiegelung“ bezeichnet. In diesem Verbund weisen alle eingebundenen Festplatten zu jedem Zeitpunkt den gleichen Datenstand auf, sodass er vollständige Redundanz bietet und den Ausfall einzelner Speichermedien problemlos auffangen kann. In der Konsequenz ist die Kapazität des RAIDs immer maximal so hoch wie die Kapazität der kleinsten beteiligten Festplatte. Die Schreibgeschwindigkeit in einem RAID 1 ist genauso schnell wie bei einem Einzellaufwerk. Durch die Anbindung der beteiligten Platten an eigene Kanäle wie z. B. SATA lässt sich jedoch die Lesegeschwindigkeit verdoppeln. Alle weiteren Informationen zu der „spiegelnden“ Speicherungsmethode liefert unser weiterführender Artikel zum Thema „RAID 1“.
RAID 5: Striping mit verteilten Paritätsinformationen
RAID 5 bezeichnet einen Verbund aus drei oder mehr Festplatten, wobei die Anzahl typischerweise ungerade ist – drei, fünf, sieben usw. Das Speicherkonzept nutzt das aus RAID 0 bekannte Striping und verteilt die Daten blockweise auf die verschiedenen Datenträger. Gemeinsam mit den Datenblöcken werden Paritätsinformationen gleichmäßig auf die eingebundenen Festplatten verteilt, die für die Wiederherstellung verlorengegangener Daten verwendet werden können, falls ein Speichermedium ausfällt. Somit sorgt RAID 5 für eine höhere Lesegeschwindigkeit und auch für mehr Sicherheit als ein Einzellaufwerk. Durch die stetig erforderliche Neuberechnung der Paritätsblöcke fällt die Schreibgeschwindigkeit aber vergleichsweise gering aus. Lesen Sie mehr zu dem Konzept in unserem gesonderten RAID-5-Artikel.
RAID 6: Striping mit doppelt verteilten Paritätsinformationen
RAID-Level 6 verfolgt einen ähnlichen Ansatz wie RAID 5: Auch bei diesem Ansatz verteilt man die Daten gleichmäßig und in Blöcken auf die eingebundenen Speicherkomponenten und sorgt durch Paritätsinformationen für mehr Sicherheit. Letztere Daten für die Wiederherstellung werden hier allerdings in doppelter Ausführung erzeugt, wodurch dieser RAID-Typus den gleichzeitigen Ausfall von bis zu zwei Festplatten verkraftet (bei einer Mindestanzahl von vier). Der Verbund bietet somit eine hohe Datensicherheit und einen guten Lesezugriff. Da die Berechnung der Paritätsblöcke noch zeitintensiver ausfällt als bei RAID 5, ist die Schreibgeschwindigkeit aber noch geringer. Im spezifischen Ratgeber über RAID 6 beleuchten wir die Stärken und Schwächen des Stripings mit doppelt verteilten Paritätsinformationen noch einmal etwas genauer.
RAID 10: RAID 0 über mehrere RAID 1
RAID 10 oder auch RAID 1+0 kombiniert die Eigenschaften von RAID-Level 0 und RAID-Level 1: Eine höhere Datendurchsatzrate und eine erhöhte Datensicherheit. Zu diesem Zweck vereint man mehrere RAID-1-Systeme in einem RAID-0-Verbund, wobei mindestens vier Festplatten benötigt werden. Wann sich eine solche Kombination lohnt und welche Nachteile sie mit sich bringt, erklären wir im detaillierten Artikel zu RAID 10.
Was ist bei der Einrichtung und Anpassung von RAIDs zu beachten?
Beim Aufbau und Betrieb eines RAID-Systems sind eine Menge Dinge zu beachten. An erster Stelle steht unweigerlich die Frage, welcher Typ von Verbund eigentlich geplant ist. Soll beispielsweise lediglich der Datendurchsatz erhöht werden, steht neben einem Level-0-System der Einsatz von SSDs als Alternative zur Verfügung. Ist eine Erhöhung der Datensicherheit gewünscht, hat man mit Mirroring (z. B. Level 1) und der Speicherung mit Paritätsinformationen (z. B. Level 5) ebenfalls zwei verschiedene Herangehensweisen parat.
Bei der Auswahl der Festplatten sind im Idealfall identische Modelle zu bevorzugen. In vielen RAID-Setups richtet sich das maximale Speichervolumen nach der kleinsten Platte, weshalb bei verschiedenartigen Größenordnungen eine Menge Speicherpotenzial verloren gehen würde. Noch wichtiger ist es, auf Hardware wie NAS-Festplatten zu setzen, die für eine hohe Langlebigkeit ausgelegt sind. Die Größe der Datenträger spielt zudem eine wichtige Rolle bei einem späteren Austausch defekter Hardware bzw. bei der Vergrößerung des RAIDs: Neue Komponenten müssen mindestens die Größe des kleinsten bisher verwendeten bzw. des defekten Datenträgers aufweisen.
Ein weiterer Punkt, der beim Einsatz eines RAID-Verbunds niemals vergessen werden sollte: Das Zusammenspiel der verschiedenen Festplatten erhöht durch Redundanz zwar die Sicherheit der gespeicherten Daten – eine gut organisierte Backup-Lösung kann und sollte ein RAID aber niemals ersetzen.
Quelle: https://www.ionos.at/digitalguide/server/sicherheit/raid/