Dom baze podataka Što je vađenje podataka? - definicija iz tehopedije

Što je vađenje podataka? - definicija iz tehopedije

Sadržaj:

Anonim

Definicija - Što znači istraživanje podataka?

Iskopavanje podataka je proces analize skrivenih obrazaca podataka prema različitim perspektivama za kategorizaciju u korisne informacije, koje se prikupljaju i sastavljaju u zajedničkim prostorima, poput skladišta podataka, za učinkovitu analizu, algoritme iskopavanja podataka, olakšavanje donošenja poslovnih odluka i druge informacije zahtjevi da se u konačnici smanje troškovi i povećaju prihodi.

Iskopavanje podataka poznato je i kao otkrivanje podataka i otkriće znanja.

Techopedia objašnjava rudarjenje podataka

Glavni koraci u procesu iskopavanja podataka su:

  • Ekstrakt, pretvaranje i učitavanje podataka u skladište podataka
  • Spremite i upravljajte podacima u višedimenzionalnim bazama podataka
  • Omogućite pristup podacima poslovnim analitičarima pomoću aplikativnog softvera
  • Analizirajte podatke u lako razumljivim oblicima, kao što su grafikoni

Prvi korak u iskopavanju podataka je prikupljanje relevantnih podataka kritičnih za poslovanje. Podaci tvrtke su ili transakcijski, neoperativni ili metapodaci. Transakcijski podaci bave se svakodnevnim operacijama poput prodaje, zaliha i troškova itd. Neoperativni podaci obično se prognoziraju, dok se metapodaci bave logičkim dizajnom baze podataka. Obrasci i odnosi među elementima podataka daju relevantne informacije, što može povećati organizacijski prihod. Organizacije s jakim fokusom potrošača bave se tehnikama rudarjenja podataka pružajući jasne slike prodanih proizvoda, cijena, konkurencije i demografije kupaca.

Primjerice, maloprodajni gigant Wal-Mart sve svoje relevantne podatke prenosi u skladište podataka s terabajtima podataka. Dobavljači lako mogu pristupiti tim podacima, što im omogućava prepoznavanje obrazaca kupnje kupaca. Mogu generirati uzorke na načinima kupovanja, većinu kupljenih dana, najviše traže proizvode i druge podatke koristeći tehnike iskopavanja podataka.

Drugi korak u iskopu podataka je odabir prikladnog algoritma - mehanizma koji proizvodi model vađenja podataka. Općenito korištenje algoritma uključuje prepoznavanje trendova u skupu podataka i korištenje izlaza za definiranje parametara. Najpopularniji algoritmi koji se koriste za vađenje podataka su algoritmi za klasifikaciju i regresijski algoritmi koji se koriste za identificiranje odnosa među elementima podataka. Glavni dobavljači baza podataka poput Oracle i SQL uključuju algoritme za iskopavanje podataka, kao što su klasteriranje i regresijsko trešnje, kako bi udovoljili potražnji za iskopavanjem podataka.

Što je vađenje podataka? - definicija iz tehopedije