Dom zvučni Što je alfago? - definicija iz tehopedije

Što je alfago? - definicija iz tehopedije

Sadržaj:

Anonim

Definicija - Što znači AlphaGo?

AlphaGo je uski AI, računalni program razvijen od strane Google DeepMind za igranje Go, kineske igre sa strateškim igrama za dva igrača slična šahu. AlphaGo je prvi program AI koji je u listopadu 2015. uspio pobijediti profesionalnog ljudskog igrača, 2-dan igrača Fan Hui-a, na ploči pune veličine bez ikakvih hendikepa. Potom je u ožujku 2016. pobijedio jednog od najplaćenijih ljudskih igrača na svijetu, 9-dan Leeja Sedola, osvojivši četiri od pet utakmica.

Tehopedija objašnjava AlphaGo

Projekt AlphaGo pokrenut je 2014. godine kao testni ležaj kako bi se utvrdilo koliko se algoritam neuronske mreže Google DeepMind koji koristi dubinsko učenje mogao natjecati u Go. Algoritam za AlphaGo kombinacija je tehnika pretraživanja stabala i tehnika strojnog učenja i ojačan opsežnom obukom kako ljudi tako i ostalih računalnih igrača. Koristi pretragu stabla Monte Carlo i vodi ga mreža politike i vrijednosti, implementirana pomoću tehnologija duboke neuronske mreže. Mreža politika je obučena i pomaže AI predvidjeti sljedeći potez koji će najvjerojatnije pobijediti, dok mreža vrijednosti trenira suziti stablo pretraživanja i odrediti vrijednost tih pozicija, procjenjujući pobjednike na svakoj poziciji, a ne pretražujući skroz dolje do kraja igre.

AlphaGo je prvi put hranjen potezima povijesnih utakmica od ljudskih igrača, koristeći bazu podataka od oko 30 milijuna poteza, čineći to oponašajući ljudsku igru. Nakon što je AI dostigao stupanj stručnosti, dodatno ga je osposobio čineći ga da igra protiv slučajeva sebe, koristeći učenje pojačanja za poboljšanje i učenje više.

U listopadu 2015. distribuirana računalna verzija AlphaGo-a igrala je i pobijedila Fan Hui-a, dva dana Dan Europskog prvaka, obilježivši prvi put da je računalni program na Go-u pobijedio profesionalnog igrača. Fan Hui je tada mjesecima nakon poraza pomagao kao savjetnik tima DeepMind-a. U ožujku 2016. AlphaGo je ušao u susret protiv Lee Sedol, jednog od najplaćenijih igrača na svijetu, postigavši ​​najvišu razinu od 9 dana. Dobivanje četiri igre od Leejeve, ovo je značilo veliki pomak u AI istraživanju jer je to značilo da se algoritam dubokog učenja i neuronskih mreža koji koristi DeepMind može koristiti u bilo koje druge svrhe, jer zapravo nije programiran za igranje Go, već je naučeno kako igrati Go. To otvara sasvim novi svijet za istraživanje AI.

Što je alfago? - definicija iz tehopedije