Sadržaj:
- Definicija - Što znači Hadoop distribuirani datotečni sustav (HDFS)?
- Techopedia objašnjava Hadoop distribuirani datotečni sustav (HDFS)
Definicija - Što znači Hadoop distribuirani datotečni sustav (HDFS)?
Hadoop Distribuirani datotečni sustav (HDFS) je distribuirani datotečni sustav koji radi na standardnom ili niskom cenovnom hardveru. Razvijen od strane Apache Hadoop, HDFS djeluje poput standardnog distribuiranog datotečnog sustava, ali omogućuje bolju protočnost podataka i pristup putem algoritma MapReduce, visoku toleranciju grešaka i izvornu podršku velikih skupova podataka.
Techopedia objašnjava Hadoop distribuirani datotečni sustav (HDFS)
HDFS pohranjuje veliku količinu podataka smještenih na više strojeva, obično u stotinama i tisućama istodobno povezanih čvorova, i pruža pouzdanost podataka umnožavanjem svake instance podataka kao tri različite kopije - dvije u jednoj grupi i jedna u drugoj. Te se kopije mogu zamijeniti u slučaju kvara.
HDFS arhitektura sastoji se od klastera, kojima se svaki pristupa pomoću jednog softverskog alata NameNode instaliranog na zasebnom stroju radi nadziranja i upravljanja datotečnim sustavom tog klastera i mehanizmom pristupa korisnicima. Ostali strojevi instaliraju jednu instancu DataNode za upravljanje pohranom klastera.
Budući da je HDFS napisan na Javi, on ima matičnu podršku za Java programska sučelja za programiranje (API) za integraciju i pristupačnost aplikacija. Također mu se može pristupiti putem standardnih web-preglednika.
