Apache Kudu

Autor: Laura McKinney
Data Creației: 1 Aprilie 2021
Data Actualizării: 8 Mai 2024
Anonim
Intro to Apache Kudu by Asim Jalis, Galvanize
Video: Intro to Apache Kudu by Asim Jalis, Galvanize

Conţinut

Definiție - Ce înseamnă Apache Kudu?

Apache Kudu este un membru al ecosistemului open-source Apache Hadoop. Este un motor de stocare open-source destinat datelor structurate care acceptă acces aleatoriu cu latență scăzută, împreună cu modele de acces analitice eficiente. Acesta a fost proiectat și implementat pentru a reduce diferența dintre sistemul de fișiere distribuite Hadoop (HDFS) pe scară largă și baza de date HBase NoSQL. Deși aceste sisteme se pot dovedi încă avantajoase, Apache Kudu poate răspunde multor sarcini comune de muncă, deoarece poate simplifica în mod dramatic arhitectura lor.


O introducere în Microsoft Azure și Microsoft Cloud | În acest ghid, veți afla despre ce este vorba despre cloud computing și despre cum Microsoft Azure vă poate ajuta să migrați și să conduceți afacerea din cloud.

Techopedia explică Apache Kudu

Apache Kudu a fost dezvoltat în primul rând ca proiect la Cloudera. Majoritatea contribuțiilor până în prezent au fost realizate de dezvoltatori angajați de Cloudera. În timpul lansării sale, în depozitele Cloudera au fost incluse doar binare convenabile, cu toate acestea a adoptat procesul de eliberare a sursei Apache Software Foundation (ASF) la intrarea în incubator. Este conceput special pentru cazuri de utilizare care necesită o analiză rapidă a datelor rapide. A fost proiectat pentru a profita de generația viitoare de procesare și procesare în memorie. Reduce semnificativ latența interogărilor pentru Apache Impala și Apache Spark. Distribuie datele prin motorul de stocare pe coloane sau prin partiționare orizontală, apoi reproduce fiecare partiție folosind consensul Raft, oferind astfel latențe medii reduse pentru recuperare și laturi mici.


Deși Kudu este un produs conceput în conținutul ecosistemului Apache Hadoop, acesta susține, de asemenea, integrarea cu alte proiecte de analiză a datelor atât în ​​ASF, cât și în afara acesteia.

Apache Kudu se dovedește a fi eficient, deoarece poate prelucra în timp real sarcini analitice de lucru pe un singur strat de stocare, oferind astfel arhitecților flexibilitate pentru a aborda o varietate mai largă de cazuri de utilizare fără rezolvări exotice.