Sadržaj:
- Definicija - Što znači Open-Source Big Data Analytics?
- Techopedia objašnjava Open-Source Big Data Analytics
Definicija - Što znači Open-Source Big Data Analytics?
Analitika velikih podataka otvorenog koda odnosi se na korištenje softvera i alata otvorenog koda za analizu ogromnih količina podataka radi prikupljanja relevantnih i djelotvornih informacija koje organizacija može koristiti u svrhu promicanja svojih poslovnih ciljeva. Apacheov Hadoop je najveći igrač u open-source analitici velikih podataka - to je najčešće korištena softverska biblioteka za obradu ogromnih skupova podataka preko skupa računala koristeći raspodijeljeni postupak za paralelizam.
Techopedia objašnjava Open-Source Big Data Analytics
Open-source analitika velikih podataka koristi se softverom i alatima otvorenog koda kako bi se izvršavala analitika velikih podataka bilo korištenjem cijele softverske platforme ili različitih alata otvorenog koda za različite zadatke u procesu analize podataka. Apache Hadoop je najpoznatiji sustav za analizu velikih podataka, ali potrebne su druge komponente prije nego što se pravi analitički sustav može sastaviti.
Hadoop je implementacija algoritma MapReduce s otvorenim kodom koji su pokrenuli Google i Yahoo, tako da je osnova većine analitičkih sustava danas. Mnogi alati za veliku analizu podataka koriste open source, uključujući robusne sustave baza podataka poput otvorenog koda MongoDB, sofisticiranu i skalabilnu NoSQL bazu podataka vrlo prikladnu za velike podatkovne aplikacije, kao i druge.
Usluge analitike velikih podataka otvorenog koda obuhvaćaju:
- Sustav prikupljanja podataka
- Upravljački centar za upravljanje i nadgledanje klastera
- Knjižnica strojnog učenja i vađenja podataka
- Usluga koordinacije aplikacija
- Računajte motor
- Izvedbeni okvir
