Google-Dateisystem (GFS)

Autor: Robert Simon
Erstelldatum: 15 Juni 2021
Aktualisierungsdatum: 13 Kann 2024
Anonim
Help for hacked sites: File system damage assessment
Video: Help for hacked sites: File system damage assessment

Inhalt

Definition - Was bedeutet Google File System (GFS)?

Google File System (GFS) ist ein skalierbares verteiltes Dateisystem (DFS), das von Google Inc. erstellt und entwickelt wurde, um den wachsenden Datenverarbeitungsanforderungen von Google gerecht zu werden. GFS bietet Fehlertoleranz, Zuverlässigkeit, Skalierbarkeit, Verfügbarkeit und Leistung für große Netzwerke und verbundene Knoten. GFS besteht aus mehreren Speichersystemen, die aus kostengünstigen Standardhardwarekomponenten aufgebaut sind. Es ist optimiert, um den unterschiedlichen Anforderungen von Googles in Bezug auf Datennutzung und -speicherung gerecht zu werden, z. B. die Suchmaschine, die große Datenmengen generiert, die gespeichert werden müssen.


Das Google-Dateisystem nutzt die Stärke von Standardservern und minimiert gleichzeitig Hardwareschwächen.

GFS wird auch als GoogleFS bezeichnet.

Eine Einführung in Microsoft Azure und die Microsoft Cloud | In diesem Handbuch erfahren Sie, worum es beim Cloud-Computing geht und wie Microsoft Azure Sie bei der Migration und Ausführung Ihres Unternehmens aus der Cloud unterstützen kann.

Techopedia erklärt Google File System (GFS)

Der GFS-Knotencluster ist ein einzelner Master mit mehreren Chunk-Servern, auf die ständig von verschiedenen Clientsystemen zugegriffen wird. Chunk-Server speichern Daten als Linux-Dateien auf lokalen Festplatten. Gespeicherte Daten werden in große Blöcke (64 MB) unterteilt, die mindestens dreimal im Netzwerk repliziert werden. Die große Blockgröße reduziert den Netzwerkaufwand.

GFS wurde entwickelt, um den hohen Clusteranforderungen von Google gerecht zu werden, ohne die Anwendungen zu belasten. Dateien werden in hierarchischen Verzeichnissen gespeichert, die durch Pfadnamen gekennzeichnet sind. Metadaten - wie z. B. Namespace, Zugriffssteuerungsdaten und Zuordnungsinformationen - werden vom Master gesteuert, der mit den Statusaktualisierungen jedes Chunkservers über zeitgesteuerte Heartbeats interagiert und diese überwacht.


Zu den GFS-Funktionen gehören:

  • Fehlertoleranz
  • Kritische Datenreplikation
  • Automatische und effiziente Datenwiederherstellung
  • Hoher Gesamtdurchsatz
  • Reduzierte Client- und Master-Interaktion aufgrund der Größe des Chunk-Servers
  • Namespace-Verwaltung und Sperren
  • Hohe Verfügbarkeit

Die größten GFS-Cluster verfügen über mehr als 1.000 Knoten mit einer Speicherkapazität von 300 TB. Auf diese können Hunderte von Clients kontinuierlich zugreifen.