Sadržaj:
- Definicija - Što znači djelomično promatrani postupak odlučivanja Markov (POMDP)?
- Tehopedija objašnjava djelomično promatrani postupak Markovske odluke (POMDP)
Definicija - Što znači djelomično promatrani postupak odlučivanja Markov (POMDP)?
Djelomično promatran Markov postupak odlučivanja (POMPD) je Markov postupak odlučivanja u kojem agent ne može izravno promatrati temeljna stanja u modelu. Proces odlučivanja Markov (MDP) matematički je okvir za modeliranje odluka koji prikazuje sustav s nizom stanja i pružanje akcija donositelju odluka na temelju tih stanja.
POMPD temelji na tom konceptu kako bi pokazao kako se sustav može nositi sa izazovima ograničenog promatranja.
Tehopedija objašnjava djelomično promatrani postupak Markovske odluke (POMDP)
U djelomično promatranom Markovom procesu odlučivanja, budući da temeljne države nisu transparentne za agent, koristan je koncept koji se naziva "uvjerenje". Stanje vjerovanja pruža način da se riješi nejasnoća svojstvenih modelu.
POMPD je koristan u učenju pojačanja gdje sustav može prelaziti MPD ili POMPD model koristeći ono što je poznato za stvaranje jasnije slike rezultata vjerojatnosti.