Sadržaj:
- Definicija - Što znači Otkrivanje znanja u bazama podataka (KDD)?
- Tehopedija objašnjava otkriće znanja u bazama podataka (KDD)
Definicija - Što znači Otkrivanje znanja u bazama podataka (KDD)?
Otkrivanje znanja u bazama podataka (KDD) proces je otkrivanja korisnog znanja iz zbirke podataka. Ova široko korištena tehnika vađenja podataka proces je koji uključuje pripremu i odabir podataka, čišćenje podataka, uključivanje prethodnog znanja o skupima podataka i interpretaciju točnih rješenja iz promatranih rezultata.
Glavna područja primjene KDD-a uključuju marketing, otkrivanje prijevara, telekomunikacije i proizvodnju.
Tehopedija objašnjava otkriće znanja u bazama podataka (KDD)
Iskopiranje podataka i otkrivanje znanja tradicionalno se obavljalo ručno. Kako je vrijeme prolazilo, količina podataka u mnogim sustavima narasla je na veću od veličine terabajta i više se nije mogla ručno održavati. Štoviše, za uspješno postojanje bilo kojeg poduzeća otkrivanje temeljnih obrazaca podataka smatra se ključnim. Kao rezultat toga, razvijeno je nekoliko softverskih alata za otkrivanje skrivenih podataka i pretpostavki koje su činile dio umjetne inteligencije.
Proces KDD-a dostigao je vrhunac u posljednjih 10 godina. Sad sadrži mnogo različitih pristupa otkrivanju, koji uključuju induktivno učenje, bajesovu statistiku, optimizaciju semantičkih upita, stjecanje znanja za stručne sustave i teoriju informacija. Krajnji je cilj izvući znanje visoke razine iz podataka na niskoj razini.
KDD uključuje multidisciplinarne aktivnosti. To uključuje pohranu i pristup podacima, algoritme skaliranja na ogromne skupove podataka i interpretiranje rezultata. Proces čišćenja i pristupa podacima koji su uključeni u skladištenje podataka olakšavaju KDD proces. Umjetna inteligencija također podržava KDD otkrivanjem empirijskih zakona eksperimentiranja i promatranja. Obrasci prepoznati u podacima moraju biti valjani na novim podacima i moraju imati određenu razinu sigurnosti. Ti se obrasci smatraju novim znanjem. Koraci uključeni u čitav KDD postupak su:
- Prepoznajte cilj KDD procesa iz perspektive kupca.
- Shvatite uključene domene aplikacija i potrebno znanje
- Odaberite ciljni skup podataka ili podskup uzoraka podataka na kojima se vrši otkrivanje.
- Očistite i prethodno obradite podatke odlučivanjem o strategijama za rukovanje nedostajućim poljima i izmjenom podataka prema zahtjevima.
- Pojednostavite skupove podataka uklanjanjem neželjenih varijabli. Zatim analizirajte korisne značajke koje se mogu koristiti za predstavljanje podataka, ovisno o cilju ili zadatku.
- Usporedite ciljeve KDD-a s metodama iskopavanja podataka kako biste predložili skrivene obrasce.
- Odaberite algoritme iskopavanja podataka kako biste otkrili skrivene obrasce. Ovaj postupak uključuje odlučivanje koji modeli i parametri mogu biti prikladni za cjelokupni KDD postupak.
- Potražite uzorke od interesa u određenom reprezentacijskom obliku, koji uključuju klasifikacijska pravila ili stabla, regresiju i grupiranje.
- Interpretirati osnovna znanja iz miniranih obrazaca.
- Koristite znanje i uključite ga u drugi sustav za daljnje postupanje.
- Dokumentirajte to i napravite izvještaje za zainteresirane strane.