Sadržaj:
Definicija - Što znači Apache Kudu?
Apache Kudu član je ekosustava Apache Hadoop otvorenog koda. To je mehanizam za pohranu otvorenog koda namijenjen strukturiranim podacima koji podržavaju slučajni pristup s malim kašnjenjem zajedno s učinkovitim uzorcima analitičkog pristupa. Dizajniran je i implementiran da premosti jaz između široko korištenog sustava distribucije datoteka Hadoop (HDFS) i baze podataka HBase NoSQL. Iako se ovi sustavi i dalje mogu pokazati povoljnim, Apache Kudu može udovoljiti mnogim uobičajenim opterećenjima jer može drastično pojednostaviti njihovu arhitekturu.
Tehopedija objašnjava Apache Kudu
Apache Kudu primarno je razvijen kao projekt u Clouderi. Većina dosadašnjih doprinosa dali su programeri zaposleni u Clouderi. Tijekom izdavanja, u spremišta Cloudera bile su uključene samo praktične binarne datoteke, međutim nakon pristupanja u inkubator je usvojio postupak puštanja izvora Apache Software Foundation (ASF). Posebno je dizajniran za slučajeve upotrebe koji zahtijevaju brzu analizu na brzim podacima. Bilo je dizajnirano tako da iskoristi prednosti hardvera nove generacije i obrade u memoriji. Apache Impala i Apache Spark značajno smanjuje kašnjenje upita. Podatke distribuira putem stupaca za pohranu podataka ili horizontalnim particijama, a zatim replicira svaku particiju koristeći konsenzus s Raftom, pružajući tako malo srednjeg vremena do oporavka i niskih kašnjenja repa.
Iako je Kudu proizvod dizajniran u kontekstu ekosustava Apache Hadoop, on također podržava integraciju s drugim projektima za analizu podataka kako u ASF-u, tako i izvan njega.
Apache Kudu pokazao se efikasnim jer može obrađivati analitičko opterećenje u stvarnom vremenu kroz jedan sloj skladištenja, pružajući arhitektima fleksibilnost u rješavanju šireg broja slučajeva uporabe bez egzotičnih zaobilaznih problema.