Sadržaj:
- Definicija - Što znači postupak Markovskog odlučivanja (MDP)?
- Tehopedija objašnjava postupak odlučivanja Markov (MDP)
Definicija - Što znači postupak Markovskog odlučivanja (MDP)?
Proces odlučivanja Markov (MDP) nešto je što profesionalci nazivaju "diskretnim vremenskim stohastičkim postupkom kontrole". Temelji se na matematici koju je ruski akademik Andrey Markov pokrenuo krajem 19. i početkom 20. stoljeća.
Tehopedija objašnjava postupak odlučivanja Markov (MDP)
Jedan od načina da se objasni postupak Markovljeve odluke i povezanih markovskih lanaca jest da su to elementi moderne teorije igara utemeljeni na jednostavnijim matematičkim istraživanjima ruskog znanstvenika prije stotinu godina. Opis procesa Markovljevog odlučivanja je da on proučava scenarij u kojem je sustav u određenom skupu stanja i prelazi naprijed prema drugoj državi na temelju odluka donositelja odluka.
Markov lanac kao model prikazuje slijed događaja u kojima vjerojatnost određenog događaja ovisi o prethodno postignutom stanju. Profesionalci mogu govoriti o „obračunatom državnom prostoru“ opisujući postupak Markovske odluke - neki povezuju ideju Markovljevog modela odluke s modelom „slučajnog hoda“ ili drugim stohastičkim modelom temeljenim na vjerojatnostima (slučajni model hodanja, koji se često navodi na zidu Street, modelira kretanje udjela prema gore ili dolje u kontekstu tržišne vjerojatnosti).
Općenito, procesi odlučivanja o Markovu često se primjenjuju na neke od najsofisticiranijih tehnologija koje danas profesionalci rade, na primjer, u modelima robotike, automatizacije i istraživanja.
