P:
Koja su neka od ključnih pitanja koja treba uzeti u obzir u strategiji pohrane velikih podataka?
A:Jedno od najvećih problema koje se zanemaruje kod pohrane velikih podataka jest pristupačnost timova kojima je to potrebno. Podaci se redovito pohranjuju bez ikakve dokumentacije, na mjestima gdje je teško pristupiti ili gdje relevantni timovi nisu zaboravljeni na činjenicu da uopće postoji. Naposljetku, za veliko pohranjivanje podataka trebala bi se otvoriti prva strategija u kojoj su timovi upoznati s njegovim postojanjem, od čega se podaci sastoje i kako im pristupiti tako da ih timovi mogu koristiti u softveru ako im trebaju.
Drugo kritično pitanje koje smatram je kvaliteta podataka koji se pohranjuju. Podaci bi trebali biti pohranjeni u obliku najviše kvalitete u kojem mogu postojati na svom konačnom mjestu pohrane. Pohranjivanje podataka niske kvalitete u jezeru podataka obično je u redu, ali kako se nastavlja niz niz podataka, svaka faza bi trebala povećati kvalitetu podataka tako da se isti pohranjuju u obliku najviše kvalitete u sustav poput skladišta podataka ili analitičke baze podataka. To će povećati kvalitetu sustava koji troše počivalište podataka.