Dom zvučni Koji je djelomično promatran postupak odlučivanja za markov (pomdp)? - definicija iz tehopedije

Koji je djelomično promatran postupak odlučivanja za markov (pomdp)? - definicija iz tehopedije

Sadržaj:

Anonim

Definicija - Što znači djelomično promatrani postupak odlučivanja Markov (POMDP)?

Djelomično promatran Markov postupak odlučivanja (POMPD) je Markov postupak odlučivanja u kojem agent ne može izravno promatrati temeljna stanja u modelu. Proces odlučivanja Markov (MDP) matematički je okvir za modeliranje odluka koji prikazuje sustav s nizom stanja i pružanje akcija donositelju odluka na temelju tih stanja.

POMPD temelji na tom konceptu kako bi pokazao kako se sustav može nositi sa izazovima ograničenog promatranja.

Tehopedija objašnjava djelomično promatrani postupak Markovske odluke (POMDP)

U djelomično promatranom Markovom procesu odlučivanja, budući da temeljne države nisu transparentne za agent, koristan je koncept koji se naziva "uvjerenje". Stanje vjerovanja pruža način da se riješi nejasnoća svojstvenih modelu.

POMPD je koristan u učenju pojačanja gdje sustav može prelaziti MPD ili POMPD model koristeći ono što je poznato za stvaranje jasnije slike rezultata vjerojatnosti.

Koji je djelomično promatran postupak odlučivanja za markov (pomdp)? - definicija iz tehopedije