P:
Kako se mogu naučiti koristiti Hadoop za analizu velikih podataka?
A:Apacheov set softvera poznat kao Hadoop postaje vrlo popularan resurs za bavljenje velikim skupima podataka. Ova vrsta softverskog okvira za obradu podataka izgrađena je kako bi se pomoglo prikupljanju podataka na specifične načine, temeljeno na dizajnu koji neke vrste podataka podataka može učiniti učinkovitijima. U skladu s tim, Hadoop je samo jedan od mnogih alata za rukovanje velikim skupima podataka.
Jedan od prvih i najosnovnijih načina za učenje o velikim podacima s Hadoop-om je razumijevanje nekih komponenti najviše razine Hadoopa i onoga što on čini. Oni uključuju Hadoop YARN "platformu za upravljanje resursima" koja se može primijeniti na određene vrste mrežnih postavki, kao i skup funkcija Hadoop MapReduce koje se primjenjuju na velike skupove podataka. Tu je i Hadoop distribuirani datotečni sustav (HDFS), koji pomaže u pohranjivanju podataka u distribuirane sustave kako bi se brzo i učinkovito indeksiralo ili moglo preuzeti.
Pored toga, oni koji se žele više upoznati s Hadoopom mogu pogledati pojedinačne objavljene resurse za profesionalce koji objašnjavaju softver na relativiziranoj razini. Ovaj primjer Chrisa Stucchia na osobnom blogu pruža izvrstan skup bodova o Hadoopu i razmjeri podataka. Jedno od osnovnih poduhvata je da se Hadoop može češće koristiti nego što je potrebno, a možda i nije najbolje rješenje za pojedini projekt. Pregledavanje ovih vrsta resursa pomoći će profesionalcima da se bolje upoznaju s pojedinostima korištenja Hadoopa u bilo kojem scenariju. Stucchio također pruža metafore za povezivanje Hadoopovih funkcija sa specifičnim fizičkim zadacima. Ovdje je primjer brojanje broja knjiga u biblioteci, dok Hadoop funkcija može raščlaniti tu biblioteku u odjeljke, pružajući pojedinačna brojanja koja su spojena u jedan zbirni rezultat podataka.
Detaljniji način na koji profesionalci mogu naučiti više o Hadoopu i njegovoj primjeni na velikim podacima je kroz posebne resurse i programe za obuku. Na primjer, tvrtka za internetsko učenje Cloudera, istaknuti pružatelj treninga na daljinu, ima niz zanimljivih opcija oko korištenja Hadoopa i sličnih vrsta rukovanja podacima.