Sadržaj:
Veliki podaci, upečatljiv naziv za ogromne količine strukturiranih, nestrukturiranih ili polustrukturiranih podataka, notorno je teško uhvatiti, pohraniti, upravljati, dijeliti, analizirati i vizualizirati, barem koristeći tradicionalne baze podataka i softverske aplikacije. Zato velike podatkovne tehnologije mogu učinkovito i učinkovito upravljati i obraditi ogromne količine podataka. Apache Hadoop pruža okvir i pridružene tehnologije za raspodjelu velikih skupova podataka na klasterima računala. Da biste shvatili velike podatke, morate malo razumjeti Hadoop. Ovdje ćemo pogledati gornje pojmove koje ćete čuti u vezi s Hadoopom - i što oni znače.
Webinar: Veliko željezo, Upoznajte velike podatke: Oslobađanje podataka glavnih okvira uz Hadoop & Spark Registrirajte se ovdje |
Ali prvo, pogledajte kako djeluje Hadoop
Prije nego što uđete u eko-sustav Hadoop, morate jasno razumjeti dvije temeljne stvari. Prvi je način na koji se datoteka pohranjuje u Hadoop; drugi je način obrade pohranjenih podataka. Sve tehnologije povezane sa Hadoop-om uglavnom rade na ova dva područja i čine ih više prilagođenima korisnicima. (Pronađite osnove kako Hadoop djeluje u načinu Kako Hadoop pomaže riješiti problem velikih podataka.)
Sada, o uvjetima.