Sadržaj:
Definicija - Što znači Q-učenje?
Q-učenje izraz je strukture algoritma koja predstavlja učenje pojačanja bez modela. Ocjenjujući politiku i koristeći stohastičko modeliranje Q-učenje pronalazi najbolji put naprijed u Markovom procesu odlučivanja.
Tehopedija objašnjava Q-učenje
Tehnička struktura algoritma učenja Q uključuje agenta, skup stanja i skup radnji po državi.
Q funkcija koristi utege za različite korake zajedno s faktorom popusta kako bi se vrijednosti nagradile.
Iako se može činiti jednostavnom idejom, Q-učenje je od najveće važnosti u mnogim vrstama modela pojačanja i dubokog učenja. Jedan od najboljih primjera je gdje se dubinsko Q-učenje koristi kako bi se programi strojnog učenja naučili strategijama igranja u različitim vrstama videoigara, na primjer, u igrama Atari iz 1980-ih. Ovdje konvolucionarna neuronska mreža uzima uzorke igre kako bi se razvio stohastički model koji će pomoći računalu da zna bolje igrati igru s vremenom.
Q-učenje ima ogroman potencijal koji pomaže u napredovanju umjetne inteligencije i strojnog učenja.