Sadržaj:
Definicija - Što znači smanjenje dimenzije?
Smanjenje dimenzija niz je tehnika strojnog učenja i statistike za smanjenje broja slučajnih varijabli koje treba uzeti u obzir. To uključuje odabir značajki i ekstrakciju značajki. Smanjenje dimenzija čini analizu podataka mnogo lakšom i bržom za algoritme strojnog učenja bez vanjskih varijabli koje obrađuju, čineći algoritme strojnog učenja bržim i jednostavnijim zauzvrat.
Tehopedija objašnjava Smanjenje dimenzija
Smanjenjem dimenzija pokušava se smanjiti broj slučajnih varijabli u podacima. Često se koristi pristup K-najbližih susjeda. Tehnike smanjenja dimenzija podijeljene su u dvije glavne kategorije: odabir značajki i ekstrakcija značajki.
Tehnike odabira značajki pronalaze manji podskup višedimenzionalnih skupa podataka za stvaranje modela podataka. Glavne strategije za skup značajki su filter, omotač (koristeći prediktivni model) i ugrađeni koji obavljaju odabir značajki tijekom izrade modela.
Ekstrakcija značajki uključuje pretvaranje podataka iz velikih dimenzija u prostore manje dimenzija. Metode uključuju analizu glavnih komponenti, PCA jezgre, PCA zasnovanu na grafu, linearnu diskriminatornu analizu i generaliziranu diskriminacijsku analizu.