Sadržaj:
Definicija - Što znači shema za čitanje?
Shema "čitanje" odnosi se na inovativnu strategiju analize podataka u novim alatima za obradu podataka poput Hadoopa i drugim uključenim tehnologijama baza podataka. U shemi na čitanju podaci se primjenjuju na plan ili shemu jer se izvlače sa pohranjenog mjesta, a ne dok idu.
Techopedia objašnjava Shemu na Read
Starije tehnologije baza podataka imale su strategiju izvršenja sheme pri pisanju - drugim riječima, podaci su se morali primijeniti na plan ili shemu kada su ušli u bazu podataka. To je učinjeno djelomično kako bi se utvrdila konzistentnost podataka, a to je jedna od glavnih prednosti sheme pri pisanju. Uz shemu čitanja, osobe koje obrađuju podatke možda će morati učiniti više posla kako bi identificirale svaki podatak, ali postoji mnogo više svestranosti.
Na temeljni način, shema-na-čitanje nadopunjuje glavne uporabe Hadoopa i srodnih alata. Tvrtke žele učinkovito prikupiti puno podataka i pohraniti ih za određenu uporabu. U skladu s tim, oni mogu skupljati nečiste ili nedosljedne podatke više nego što vrijede strogi režim provođenja podataka. Drugim riječima, Hadoop može primiti širok raspon različitih sitnih bitova podataka koji možda nisu u potpunosti organizirani. Tada se, kako se te informacije koriste, organiziraju. Primjena starog sustava sheme pisanja na bazi podataka značila bi da će manje organizirani podaci biti izbačeni.
Drugi način da ovo napišemo jest da je shema na pisanju bolja za dobivanje vrlo čistih i dosljednih skupova podataka, ali ti setovi mogu biti ograničeniji. Shema na čitanju baca širu mrežu i omogućuje svestraniju organizaciju podataka. Stručnjaci također ističu da je lakše stvoriti dva različita prikaza istih podataka sa shemom na čitanju.
Ova strategija čitanja sheme jedan je bitan dio zašto su Hadoop i srodne tehnologije toliko popularne u današnjoj tehnologiji poduzeća. Poduzeća koriste velike količine neobrađenih podataka za napajanje svih vrsta poslovnih procesa primjenom nerazumljive logike i drugih sustava sortiranja i filtriranja koji uključuju korporativna skladišta podataka i drugu veliku imovinu podataka.