Inhalt
- Definition - Was bedeutet Google File System (GFS)?
- Eine Einführung in Microsoft Azure und die Microsoft Cloud | In diesem Handbuch erfahren Sie, worum es beim Cloud-Computing geht und wie Microsoft Azure Sie bei der Migration und Ausführung Ihres Unternehmens aus der Cloud unterstützen kann.
- Techopedia erklärt Google File System (GFS)
Definition - Was bedeutet Google File System (GFS)?
Google File System (GFS) ist ein skalierbares verteiltes Dateisystem (DFS), das von Google Inc. erstellt und entwickelt wurde, um den wachsenden Datenverarbeitungsanforderungen von Google gerecht zu werden. GFS bietet Fehlertoleranz, Zuverlässigkeit, Skalierbarkeit, Verfügbarkeit und Leistung für große Netzwerke und verbundene Knoten. GFS besteht aus mehreren Speichersystemen, die aus kostengünstigen Standardhardwarekomponenten aufgebaut sind. Es ist optimiert, um den unterschiedlichen Anforderungen von Googles in Bezug auf Datennutzung und -speicherung gerecht zu werden, z. B. die Suchmaschine, die große Datenmengen generiert, die gespeichert werden müssen.
Das Google-Dateisystem nutzt die Stärke von Standardservern und minimiert gleichzeitig Hardwareschwächen.
GFS wird auch als GoogleFS bezeichnet.
Eine Einführung in Microsoft Azure und die Microsoft Cloud | In diesem Handbuch erfahren Sie, worum es beim Cloud-Computing geht und wie Microsoft Azure Sie bei der Migration und Ausführung Ihres Unternehmens aus der Cloud unterstützen kann.
Techopedia erklärt Google File System (GFS)
Der GFS-Knotencluster ist ein einzelner Master mit mehreren Chunk-Servern, auf die ständig von verschiedenen Clientsystemen zugegriffen wird. Chunk-Server speichern Daten als Linux-Dateien auf lokalen Festplatten. Gespeicherte Daten werden in große Blöcke (64 MB) unterteilt, die mindestens dreimal im Netzwerk repliziert werden. Die große Blockgröße reduziert den Netzwerkaufwand.
GFS wurde entwickelt, um den hohen Clusteranforderungen von Google gerecht zu werden, ohne die Anwendungen zu belasten. Dateien werden in hierarchischen Verzeichnissen gespeichert, die durch Pfadnamen gekennzeichnet sind. Metadaten - wie z. B. Namespace, Zugriffssteuerungsdaten und Zuordnungsinformationen - werden vom Master gesteuert, der mit den Statusaktualisierungen jedes Chunkservers über zeitgesteuerte Heartbeats interagiert und diese überwacht.
Zu den GFS-Funktionen gehören:
- Fehlertoleranz
- Kritische Datenreplikation
- Automatische und effiziente Datenwiederherstellung
- Hoher Gesamtdurchsatz
- Reduzierte Client- und Master-Interaktion aufgrund der Größe des Chunk-Servers
- Namespace-Verwaltung und Sperren
- Hohe Verfügbarkeit
Die größten GFS-Cluster verfügen über mehr als 1.000 Knoten mit einer Speicherkapazität von 300 TB. Auf diese können Hunderte von Clients kontinuierlich zugreifen.