P:
Više nije uvijek bolje. Kako organizacije mogu smanjiti buku u svojim podacima kako bi postigle ciljanu i točnu analitiku?
A:Uz velike sustave podataka, jedno od glavnih pitanja tvrtkama je kako održati te projekte dobro ciljanim i učinkovitim. Mnogi alati i resursi izgrađeni za velike podatke izgrađeni su za usisavanje ogromnih količina informacija u široku mrežu. Nisu uvijek pozorni na pročišćavanje tih podataka i njihovo jednostavno praćenje. Međutim, postoje neke najbolje prakse u industriji kako bi se stvorili više ciljani i korisni projekti velikih podataka.
Jedan od ciljeva ciljanog pristupa velikim podacima jest upotreba ispravnih softverskih alata i resursa. Nisu svi analitički i sustavi velikih podataka isti. Neki mogu učinkovitije filtrirati pretjerane ili nevažne podatke i omogućiti tvrtkama da se usredotoče na bitne činjenice koje će odrediti njihove temeljne procese i poslovanje.
Drugi veliki dio toga uključuje ljude. Prije nego što se uključi u veliki projekt podataka, i dok nabavlja softver dobavljača, slijedi implementaciju i obučava druge, središnja skupina ljudi mora biti zadužena za taj proces, a delegirati i istraživačke i brainstorming zadatke. Ovo može pretvoriti velike podatke u preciznu, kiruršku metodu koja će poboljšati posao bez pretjerane težine i ometanja svakodnevnih operacija.
Na primjer, radne skupine ili druge temeljne skupine mogu sjesti i detaljno razmotriti načine na koje će se provoditi, kako će posao početi ocjenjivati skupove podataka, kako će unakrsno indeksirati račune, kakav papir ili digitalne prezentacije koje će koristiti za širenje tih informacija, način izrade korisnih izvještaja, itd. Ti će podaci zaštititi poslovanje od stvaranja velikih podataka.
Također, kako tvrtke počinju nabavljati više dobavljačkih usluga, čine li veće krupne podatke i čine složenije IT arhitekture, naučili su odvajati najosjetljivije podatke od svega ostalog.
Jedan od načina za to je stvaranje slojevitog sustava. Na primjer, temeljni skup podataka ID-a i povijesti kupaca može se čuvati u posebno održavanoj bazi podataka prema određenom ugovoru o sigurnosti u oblaku ili na licu mjesta. Ostali skupovi podataka mogu se nalaziti u manje specijaliziranim podatkovnim okruženjima bilo zato što su manje osjetljivi u pogledu kršenja podataka, bilo zato što su manje izravno relevantni za analitiku koju posao obavlja. Slojni ili višerazinski sustavi omogućuju ekonomičnu implementaciju velikih podataka.
Ovo su neki od načina na koji tvrtke postaju pametne oko dobivanja velikih podataka na pravi način. Umjesto da usisavaju bilo koje podatke koje mogu prikupiti, oni određeni skup podataka smatraju najkritičnijim za dobivanje najviše poslovne inteligencije uz najmanje napora.