Sadržaj:
Definicija - Što znači klasteriranje K-znači?
K-znači klasteriranje je jednostavan algoritam učenja bez nadzora koji se koristi za rješavanje problema klastera. Slijedi jednostavan postupak razvrstavanja datog skupa podataka u više klastera, definiranih slovom "k", koje je unaprijed određeno. Klasteri se zatim pozicioniraju kao točke, a sva opažanja ili podatkovne točke pridružuju se najbližem klasteru, računaju, podešavaju i tada postupak započinje korištenjem novih podešavanja dok se ne postigne željeni rezultat.
K-znači klasteriranje koristi u tražilicama, segmentaciju tržišta, statistiku, pa čak i astronomiju.
Techopedia objašnjava K-Means Clustering
K-znači klasteriranje je metoda koja se koristi za analizu klastera, posebno u iskopavanju podataka i statistici. Cilj je podijeliti skup opažanja na brojne skupine (k), što rezultira podjelom podataka u Voronoijeve ćelije. Može se smatrati metodom otkrivanja kojoj grupi određeni objekt stvarno pripada.
Koristi se uglavnom u statistici i može se primijeniti na gotovo svaku granu studija. Na primjer, u marketingu se može koristiti za grupiranje različitih demografija ljudi u jednostavne skupine koje trgovcima olakšavaju ciljanje. Astronomi ga koriste za prosijavanje ogromnih količina astronomskih podataka; s obzirom da ne mogu svaki predmet analizirati jedan po jedan, potreban im je način da statistički pronađu zanimljive točke za promatranje i istraživanje.
Algoritam:
- K točke postavljaju se u objektni podatkovni prostor koji predstavljaju početnu skupinu centroida.
- Svaki objekt ili podatkovna točka dodijeljen je najbližem k.
- Nakon što su svi objekti dodijeljeni, položaji k centroida se preračunavaju.
- Koraci 2 i 3 ponavljaju se sve dok se položaji centroida više ne pomiču.




