Dom Razvoj Kako koncept ravnoteže može informirati o projektima strojnog učenja?

Kako koncept ravnoteže može informirati o projektima strojnog učenja?

Anonim

P:

Kako koncept ravnoteže može informirati o projektima strojnog učenja?

A:

Općenito, ravnoteža će informirati strojno učenje nastojeći stabilizirati strojno okruženje za učenje i stvoriti ishode kompatibilnim mješavinom determinističkih i vjerojatnih sastavnica.

Stručnjaci opisuju "ravnotežu" kao situaciju u kojoj racionalni akteri u sustavu strojnog učenja postignu konsenzus o strateškim akcijama - posebno, Nash-ova ravnoteža u teoriji igara uključuje dva ili više tih racionalnih aktera koji konsolidiraju strategije priznajući da nijedan igrač nema koristi od promjena određene strategije ako ostali igrači ne promijene svoje.

Besplatno preuzimanje: Strojno učenje i zašto je to važno

Posebno popularna i jednostavna demonstracija Nash-ove ravnoteže uključuje jednostavnu matricu u kojoj dva igrača biraju binarni ishod.

Navedeno je prilično tehnički način opisivanja ravnoteže i njezina djelovanja. Mnogo neformalniji način ilustriranja koncepta ravnoteže, posebno gornjeg primjera dvojice racionalnih aktera od kojih svaki ima binarni izbor, jest razmisliti o tome što biste mogli nazvati scenarijem „hodanja jedni prema drugima u hodniku srednje škole“.

Pretpostavimo da dvije osobe hodaju u različitim smjerovima hodnikom srednje škole (ili bilo kojom drugom vrstom područja) u kojem ima prostora za samo dvije osobe. Dva otvorena puta su binarni ishodi. Ako dva racionalna aktera odaberu različite binarne ishode koji se ne sukobljavaju jedan s drugim, proći će jedan pokraj drugog i pozdraviti ih. Ako odaberu dva konfliktna binarna ishoda - oni hodaju istim prostorom, a jedan od njih će morati popustiti.

U gornjem primjeru, ako dva racionalna aktera odaberu dva kompatibilna i nekonfliktna ishoda, opći konsenzus je da niti jedan ne postiže promjenom svoje strategije - u ovom slučaju svojih smjerova hodanja - ako druga osoba ne promijeni svoje.

Navedeno predstavlja ravnotežu koja se može modelirati u bilo kojem konstrukciji strojnog učenja. S obzirom na ovaj jednostavni primjer, ishod će uvijek biti suradnja dva racionalna aktera, ili drugim riječima, dvoje ljudi koji prolaze jedan pored drugog.

Suprotno bismo mogli nazvati „neravnotežom“ - ako dva racionalna aktera odaberu sukobljene ishode, kao što je spomenuto, jedan od njih će morati donijeti. Međutim, ML program koji to modelira mogao bi biti bačen u beskonačnu petlju ako se obojica odluče ustupiti - slično kao da se dvoje ljudi kreću kako bi se pokušali prilagoditi jedni drugima i dalje nastaviti koračati prema sudaru.

Ravnoteže poput one iznad one općenito će se koristiti u strojnom učenju za stvaranje konsenzusa i stabilizaciju modela. Inženjeri i programeri potražit će one scenarije i situacije koji imaju koristi od ravnoteže te će raditi na promjeni ili rješavanju onih koji to ne čine. Gledajući primjere iz stvarnog svijeta koji odgovaraju ML ravnotežama, lako je vidjeti kako je ova vrsta analize u sustavu strojnog učenja jedinstveno poučna za smišljanje načina modeliranja ljudskog ponašanja stvaranjem racionalnih aktera i agenata. To je samo jedan izvrstan primjer kako se ravnoteža može iskoristiti za napredak u primjeni sustava strojnog učenja.

Kako koncept ravnoteže može informirati o projektima strojnog učenja?