Sadržaj:
Definicija - Što znači karakterizacija?
Karakterizacija je velika metodologija podataka koja se koristi za generiranje opisnih parametara koji učinkovito opisuju karakteristike i ponašanje određene stavke podataka. Zatim se koristi u algoritmima nenadziranog učenja kako bi se pronašli obrasci, klasteri i trendovi bez uključivanja oznaka klase koje mogu imati pristranosti. To ima koristi u analizi klastera, pa čak i u dubokom učenju.
Tehopedija objašnjava karakterizaciju
Karakterizacija velikih podataka tehnika je pretvaranja neobrađenih podataka u korisne informacije, koja se koristi u algoritmima strojnog učenja i vađenja podataka. Karakterizacija u osnovi generira kondenzirane prikaze bilo kojeg informacijskog sadržaja koji je skriven unutar podataka. Stoga se može koristiti kao sredstvo za mjerenje i praćenje događaja, promjena i novonastalih ponašanja u velikim dinamičkim protocima podataka.
Neke prednosti karakterizacije:
- Može generirati korisne metrike za praćenje i mjerenje događaja i anomalija u skupovima podataka
- Stvara male predstavke esencijalnih informacija
- Brzo vrši pretvorbu podataka u informacije, što industriju približava potpunom preobrazbi podataka u informacije.
- Korisno je za indeksiranje i označavanje određenih objekata, događaja i ostalih značajki u prikupljanju podataka