Sadržaj:
Definicija - Što znači paralelna analiza podataka?
Paralelna analiza podataka metoda je za analizu podataka koristeći paralelne procese koji se istodobno odvijaju na više računala.
Proces se koristi u analizi velikih skupova podataka poput velikih zapisa telefonskih poziva, mrežnih zapisa i web spremišta za tekstualne dokumente koji mogu biti preveliki da bi se mogli smjestiti u jednu relacijsku bazu podataka. Metoda se često koristi u analizi velikih podataka i općenitoj analizi podataka.
Techopedia objašnjava paralelnu analizu podataka
Primarni koncept paralelne analize podataka je paralelizam, definiran u računanju kao istodobna izvedba procesa.
To se često postiže korištenjem više procesora ili čak više računala i uobičajena je praksa u distribuiranom računanju. U paralelnoj analizi podataka različita računala koja obavljaju različite aspekte analize podataka istovremeno provode te procese i kasnije konsolidiraju rezultate u jednom velikom izvještaju.
Razlog za ovaj paralelizam je uglavnom u tome što je analiza brža, ali i zato što su neki skupovi podataka možda previše dinamični, preveliki ili jednostavno previše nespretni da bi se učinkovito smjestili u jednu relacijsku bazu podataka. Rezultat bi bio da su ti skupovi podataka smješteni u različitim bazama podataka optimiziranim za tu vrstu podataka i u različitim strojevima, tako da linearna analiza jednostavno neće biti učinkovita opcija.
