Dom Razvoj Što je učenje ojačanja? - definicija iz tehopedije

Što je učenje ojačanja? - definicija iz tehopedije

Sadržaj:

Anonim

Definicija - Što znači pojačano učenje?

Ojačavanje učenja, u kontekstu umjetne inteligencije, je vrsta dinamičkog programiranja koja trenira algoritme koristeći sustav nagrade i kazne.

Algoritam ili agent za učenje pojačanja uči interakcijom s okolinom. Agent prima nagrade ako pravilno radi, a kazne za pogrešno obavljanje. Agent uči bez intervencije od strane čovjeka tako što povećava nagradu i minimalizira kaznu.

Tehopedia objašnjava ojačavanje učenja

Ojačavanje učenja je pristup strojnom učenju koji je inspiriran biheviorističkom psihologijom. To je slično načinu na koji dijete uči obavljati novi zadatak. Učenje ojačanja razlikuje se od drugih pristupa strojnom učenju s obzirom na to da algoritam nije izričito rekao kako izvršavati zadatak, već samostalno prolazi kroz problem.

Kao agent, koji bi mogao biti auto koji se vozi ili program koji igra šah, djeluje u okruženju, dobiva nagradno stanje ovisno o izvedbi, poput sigurne vožnje do odredišta ili pobjede u igri. Suprotno tome, agent dobiva kaznu za pogrešno obavljanje poslova, poput izlaska s ceste ili provjere.

Agent s vremenom donosi odluke kako bi povećao svoju nagradu i smanjio kaznu koristeći dinamično programiranje. Prednost ovog pristupa umjetnoj inteligenciji je u tome što omogućava programu AI da nauči bez da programer precizira kako agent treba izvršiti zadatak.

Što je učenje ojačanja? - definicija iz tehopedije