Dom To-Business Što je nestrukturirano vađenje podataka? - definicija iz tehopedije

Što je nestrukturirano vađenje podataka? - definicija iz tehopedije

Sadržaj:

Anonim

Definicija - Što znači nestrukturirano istraživanje podataka?

Nestrukturirano vađenje podataka praksa je promatranja relativno nestrukturiranih podataka i pokušavanja izvlačenja iz njih više rafiniranih podataka. Često se sastoji od vađenja podataka iz izvora koji se tradicionalno ne koriste u aktivnostima vađenja podataka.


Tehopedia objašnjava nestrukturirano istraživanje podataka

Općenito, vađenje podataka je praksa češljanja kroz skupove podataka i pokušaja dobivanja samo najvrjednijih bita informacija u određeni format. To je obično teže s relativno nestrukturiranim podacima. IT stručnjaci definiraju nestrukturirane podatke kao podatke koji nisu u određenom formatu, podatke koji su "teški u tekstu" ili podatke koji su "skriveni" u nepreciznim dokumentima koji službeno nisu naređeni za pružanje tehničkih podataka.


Primjer nestrukturiranog dokumenta bilo bi pismo ili prepiska dviju ili više strana. U nestrukturiranom iskopavanju podataka, tehnologije bi slomile to pismo, tražeći specifične identifikatore i bitove informacija poput imena povezanih osoba, datuma slanja pisama, imena uključenih tvrtki, iznosa valute ili drugih kvantificirajućih podataka bitovi podataka ili kodovi dodijeljeni određenim proizvodima, uslugama ili ponudama. Te se vrste podataka miniraju i zatim stavljaju u format koji tvrtke ili druge stranke mogu koristiti za brzu referencu ili za razvijene aplikacije poslovne inteligencije.

Što je nestrukturirano vađenje podataka? - definicija iz tehopedije