Apache Kudu

Autor: Laura McKinney
Erstelldatum: 1 April 2021
Aktualisierungsdatum: 11 Kann 2024
Anonim
Intro to Apache Kudu by Asim Jalis, Galvanize
Video: Intro to Apache Kudu by Asim Jalis, Galvanize

Inhalt

Definition - Was bedeutet Apache Kudu?

Apache Kudu ist Mitglied des Open-Source-Ökosystems Apache Hadoop. Es handelt sich um eine Open-Source-Speicher-Engine für strukturierte Daten, die einen Direktzugriff mit geringer Latenz sowie effiziente analytische Zugriffsmuster unterstützt. Es wurde entwickelt und implementiert, um die Lücke zwischen dem weit verbreiteten Hadoop Distributed File System (HDFS) und der HBase NoSQL-Datenbank zu schließen. Obwohl sich diese Systeme immer noch als vorteilhaft erweisen können, kann Apache Kudu viele gängige Workloads bedienen, da sie ihre Architektur dramatisch vereinfachen können.


Eine Einführung in Microsoft Azure und die Microsoft Cloud | In diesem Handbuch erfahren Sie, worum es beim Cloud-Computing geht und wie Microsoft Azure Sie bei der Migration und Ausführung Ihres Unternehmens aus der Cloud unterstützen kann.

Techopedia erklärt Apache Kudu

Apache Kudu wurde hauptsächlich als Projekt in Cloudera entwickelt. Die meisten Beiträge stammen von Entwicklern, die bei Cloudera beschäftigt sind. Während der Veröffentlichung wurden nur Convenience-Binärdateien in die Cloudera-Repositorys aufgenommen. Beim Beitritt zum Inkubator wurde jedoch der Quellfreigabeprozess von Apache Software Foundation (ASF) übernommen. Es wurde speziell für Anwendungsfälle entwickelt, die eine schnelle Analyse schneller Daten erfordern. Es wurde entwickelt, um Hardware der nächsten Generation und In-Memory-Verarbeitung zu nutzen. Dadurch wird die Abfragelatenz für Apache Impala und Apache Spark erheblich verringert. Es verteilt Daten über eine Spaltenspeicher-Engine oder durch horizontale Partitionierung und repliziert dann jede Partition unter Verwendung des Raft-Konsenses, wodurch eine geringe mittlere Wiederherstellungszeit und geringe Latenzzeiten für das Tail erzielt werden.


Obwohl Kudu ein Produkt ist, das innerhalb des Apache Hadoop-Ökosystems entwickelt wurde, unterstützt es auch die Integration mit anderen Datenanalyseprojekten sowohl innerhalb als auch außerhalb der ASF.

Apache Kudu erweist sich als effizient, da es Analyse-Workloads in Echtzeit auf einer einzigen Speicherebene verarbeiten kann. Auf diese Weise können die Architekten flexibel auf eine Vielzahl von Anwendungsfällen ohne exotische Problemumgehungen zugreifen.