DataStage Parallel Extender (DataStage PX)

Autor: Lewis Jackson
Erstelldatum: 10 Kann 2021
Aktualisierungsdatum: 9 Kann 2024
Anonim
Datastage: Extract: Sequential File Stage
Video: Datastage: Extract: Sequential File Stage

Inhalt

Definition - Was bedeutet DataStage Parallel Extender (DataStage PX)?

DataStage Parallel Extender (DataStage PX) ist ein IBM Datenintegrationstool. Es ist eines der vielen weit verbreiteten Extraktions-, Transformations- und Ladetools (ETL) in der Data Warehousing-Branche. Dieses Tool kann Informationen aus heterogenen Quellen sammeln, Transformationen gemäß den Unternehmensanforderungen durchführen und die Daten in entsprechende Data Warehouses laden.

DataStage PX kann auch als DataStage Enterprise Edition bezeichnet werden.


Eine Einführung in Microsoft Azure und die Microsoft Cloud | In diesem Handbuch erfahren Sie, worum es beim Cloud-Computing geht und wie Microsoft Azure Sie bei der Migration und Ausführung Ihres Unternehmens aus der Cloud unterstützen kann.

Techopedia erklärt DataStage Parallel Extender (DataStage PX)

DataStage Parallel Extender verfügt über eine parallele Architektur zur Datenverarbeitung. Die beiden Hauptarten der in DataStage PX implementierten Parallelität sind Pipeline- und Partitionsparallelität. Die Möglichkeit, Daten parallel zu verarbeiten, beschleunigt die Datenverarbeitung erheblich.

Der DataStage Parallel Extender umfasst verschiedene Phasen, in denen Quelldaten verarbeitet und in Zieldatenbanken verstärkt werden. Diese sind in Terabyte definiert. Neben den Phasen verwendet DataStage PX Container, um die Auftragskomponenten und -sequenzen wiederzuverwenden und mehrere Aufträge gleichzeitig auszuführen und zu planen.

Die am häufigsten verwendeten Phasen in DataStage Parallel Extender sind:


  • Transformator
  • Aggregator
  • Datensatz
  • Kopieren
  • Änderung anwenden
  • Ändern
  • Filter
  • Beitreten
  • Verschmelzen
  • Sieh nach oben