Ceph

Im Jahre 2012 präsentierte die Firma Inktank eine neuartige Storage-Software, die keine Neuanschaffung der Hardware voraussetzt, als OpenSource-Software kostenlos ist und sich nach den Bedürfnissen der Benutzer maßschneidern lässt. Ceph war geboren.

Seit 2014 steht die Software im Besitz des Unternehmens von RedHat. Im Jahr 2017 wurde die 12. Version veröffentlicht. Eigenschaften wie Skalierbarkeit und die redundante Verteilung von Daten sind nur zwei von vielen Punkten. Ceph ist eine der zuverlässigsten Storage-Lösungen am Markt.



Ceph


EI-TEA Partner beschäftigt sich schon seit mehreren Jahren mit dieser Storage-Lösung.

Was genau diese Software so einzigartig macht und von den anderen abhebt? Das erklären wir Ihnen gerne an folgenden Eigenschaften:


Aufbau

Der Aufbau einer Ceph Umgebung ist leicht erklärt. Die einzelnen Knoten sind sogenannte Nodes, welche zu einem Cluster zusammengefügt werden. Ein Cluster kann aus mehreren Sites oder Rechenzentren bestehen. Cluster lassen sich untereinander verbinden, um zum Beispiel Daten zu replizieren.


Redundanz

Ceph verteilt Datenkopien. Diese Repliken werden nach einem Algorithmus über den gesamten Cluster auf verschiedene Servern und somit Festplatten verteilt.

Ein klassisches RAID sucht man hier vergebens. Die Verfügbarkeit wird nicht durch einen Zusammenschluss von Festplatten zu einem RAID10, RAID5, RAID6 oder dergleichen realisiert, sondern die Verfügbarkeit wird anhand der Daten (Objekte) definiert. Ein Objekt kann dabei eine einzelne Datei oder eine normale LUN sein. Standardmäßig werden von einem Objekt zwei Kopien angelegt. Durch diese Methode sind diese Objekte mindestens drei Mal vorhanden. Zwei Kopien und das Original. Dieser Wert kann jedoch erhöht oder verringert werden.

Die entsprechenden Festplatten werden in sogenannte Pools eingeteilt. Der Pool bestimmt, wie oft ein Objekt repliziert wird. In den neueren Versionen von Ceph gibt es das sogenannte Erasure code Profile. Dieses splittet die Objekte und verteilt sie über die entsprechenden Speichermedien, um den nötigen Festplattenspeicher noch effizienter zu nutzen.


Fragmentierung

Durch Zerstreuung der Daten auf mehreren Nodes, respektive Festplatten oder SSD‘s lässt Ceph keinen „Single-Point-of-Failure“ zu. Alle Daten und deren Kopien werden auf verschiedene Speicherbereich aufgeteilt. Nach Ausfall eines oder mehrerer Laufwerke können diese Daten aus anderen Blöcken wiederhergestellt werden.

Manche von Ihnen werden sich nun wundern – Fragmentierung? Das war unter Windows immer ein Thema, wenn die Festplattenzugriffe nicht mehr so schnell waren, wie gewünscht. Bei Ceph ist die Fragmentierung gewünscht! Zum einen werden die Daten vor Ausfall geschützt, zum anderen steigt die Lesegeschwindigkeit, da ein Objekt von mehreren Festplatten (OSD) gelesen werden kann.


Skalierbarkeit

Die Flexibilität der Software bietet Ihnen die nötige Freiheit, um Ihren Bedarf entsprechend horizontal sowie vertikal zu skalieren. Sie können selbst entscheiden, ob sie nur weitere Festplatten in Ihre Server verbauen, um mehr Speicherplatz zu erhalten, oder gleich neue Nodes anschaffen, um auch die CPU und Netzwerkperformance zu erhöhen. Dabei erkennt Ceph eigenständig, um welches Speichermedium (SATA, SAS, SSD,…) es sich handelt. Dadurch gelingt die Zuweisung der Bereich noch leichter.


Automatik

Algorithmen und Deamons sorgen für einen vollautomatisierten und zuverlässigen Ablauf. Jede Komponente, jeder Prozess ist mindestens zwei Mal vorhanden. Durch diese Eigenschaft gibt es keine Single-Point-of-Failure.


Der Software Layer von Ceph basiert auf einem sogenannten Software-Defined-Storage-System (SDS). SDS abstrahiert die Software von der Hardware. Dadurch ist man nicht auf einen Herstelle fixiert.


Ceph Eigenschaften

Die vollautomatisierte und verlässliche Eigenschaft von Ceph basiert auf dem Modul RADOS (=Reliable Autonomic Distributed Object Store). Das Produkt ist als Software-Defined-Storage-System aufgebaut. SDS sorgt dafür, dass keine Modernisierung der Hardware nötig ist. RADOS ist zugleich für die Umwandlung von Dateien auf Objekten zuständig. Diese Objekte sind nach wie vor Dateien die Ceph als Objekte darstellt.

Diese Objekte werden mit einer ID versehen, noch bevor sie in der OSD (=Object-Storage-Device) endgültig abgespeichert werden.

OSDs sind einfach erklärt, physikalische Speichermedien wie SSDs, HDDs oder Raid-Volumes. Eine OSD kann man sich im Groben wie eine Festplatte vorstellen. In jeder OSD liegt ein OSD Deamon dessen Aufgabe es ist, mehrere gleiche Objekte in verschiedenen Orten abzuspeichern, sowie die Heilung und Wiederherstellung der Daten.

CRUSH (= Controlled Replication Under Scalable Hashing)ist ein Algorithmus der entscheidet wohin die Blöcke verstreut werden. Unter der CRUSH-Map ist zu sehen wo all die Objekte liegen.

Ceph bietet noch viele weitere Funktionen und Vorteile.

EI-TEA Partner unterstützt Sie gerne bei Fragen rund um Ceph.