Dom zvučni Vodič za preživljavanje podatkovnog jezera: što, zašto i kako podatkovno jezero

Vodič za preživljavanje podatkovnog jezera: što, zašto i kako podatkovno jezero

Anonim

U prošlosti, kad smo razmišljali o digitalnim podacima, imalo je smisla razdvojiti podatke između transakcijskih podataka, podataka snimljenih u poslovnim aplikacijama, pohranjenih u tablicama baza podataka i predstavljenih BI alatima, i svih ostalih podataka: e-pošte, web stranice, slike, video i tako dalje. U današnje vrijeme takve „druge podatke“ nazivamo nestrukturiranim podacima.

Bez obzira na to, analiza i softver za dobivanje vrijednosti iz takvih podataka prešli su ponor. Upravo je taj analitički imperativ više nego išta drugo doveo do izvornog koncepta jezera podataka, spremišta podataka za obje vrste podataka i, osim toga, za podatke prikupljene iz više izvora izvan poslovnog, od kojih su neki bili neizbježno nestrukturirani.

U ovom ćemo radu ispitati kako se novi ekosustav koji je stvorio podatkovno jezero više neće u potpunosti sastojati od transakcija (ili događaja) poslovanja. Također će sadržavati podatke iz drugih izvora koje poslovanje koristi za obavljanje analitike i informiranje svojih korisnika o važnim informacijama na kojima se mogu temeljiti odluke. Sustav evidencije bit će, kao i uvijek, zlatna kopija korporativnih podataka i revizijski trag IT aktivnosti poslovanja.

Vodič za preživljavanje podatkovnog jezera: što, zašto i kako podatkovno jezero