Sadržaj:
Definicija - Što znači ekosustav Hadoop?
Hadoop ekosustav odnosi se na različite komponente softverske biblioteke Apache Hadoop, kao i na pribor i alate koje pruža Apache Software Foundation za ove vrste softverskih projekata i na načine na koji rade zajedno.
Hadoop je okvir sa sjedištem na Javi koji je izuzetno popularan za rukovanje i analizu velikih skupova podataka.
Techopedia objašnjava Hadoop ekosustav
I osnovni Hadoop paket i njegova dodatna oprema uglavnom su projekti otvorenog koda koji licencira Apache. Ideja ekosustava Hadoop uključuje upotrebu različitih dijelova jezgre Hadoop skupa, poput MapReduce, okvira za rukovanje ogromnim količinama podataka i Hadoop distribuiranog datotečnog sustava (HDFS), sofisticiranog sustava za upravljanje datotekama. Tu je i YARN, upravitelj resursa Hadoop.
Uz ove osnovne elemente Hadoopa, Apache je isporučio i druge vrste dodataka ili komplementarnih alata za programere. To uključuje Apache košnicu, alat za analizu podataka; Apache Spark, opći motor za obradu velikih podataka; Apache Pig, jezik protoka podataka; HBase, alat za bazu podataka; i Ambarl, koji se može smatrati upravljačem ekosustava Hadoop, jer pomaže zajedničkoj upotrebi tih različitih resursa Apache. Budući da je Hadoop de facto postao standard za prikupljanje podataka i postao sveprisutan u mnogim organizacijama, menadžeri i vođe razvoja uče sve o Hadoop ekosustavu i vrstama stvari koje su uključene u općenito postavljanje Hadoopa.