SI w kilka godzin potrafi opanować grę do (prawie) perfekcji
Sztuczna inteligencja z etapu kompletnego amatora na poziom mistrza potrafi wejść już po kilku godzinach treningu. Kolejne osiągnięcie DeepMind.
DeepMind udowodnił niedawno, że sztuczna inteligencja najlepiej nauczy się sama. „Program” tego zespołu wygrał już co mógł w Go, a teraz powtórzył to w szachach i shogi.
Firma DeepMind stworzyła AlphaZero, wykorzystujące tzw. reinforcement learning. Polega to na tym, że „program” zna tylko podstawowe wytyczne (w tym przypadku zasady gry), ale poszczególne taktyki próbuje opracować sam, zamiast kopiować najlepsze ruchy swoich rywali z przeszłości (jak ma to miejsce u typowej sztucznej inteligencji.
Czy taka metoda uczenia się jest efektywna? To mało powiedziane. Jak się bowiem okazuje, wystarczyły cztery godziny, by AlphaZero opanowało grę w szachy do tego stopnia, by pokonać „mistrzowski silnik szachowy” Stockfish. Wynik: 72 remisy i ...28 zwycięstw sztucznej inteligencji od DeepMind. Dodajmy, że by wygrać w shogi wystarczyły 2 godziny treningu.
Zdania na temat tego, czy jest to aż tak duże osiągnięcie, są podzielone. Pojawiają się głosy, że gra nie była przeprowadzona na sprawiedliwych warunkach (to znaczy, że na wykonanie ruchów było zbyt wiele czasu, a moc obliczeniowa dana jednemu i drugiemu „zawodnikowi” nie była równa). Nawet jednak jeśli AlphaZero nie jest jeszcze lepsze niż Stockfish, jest bardzo dobrym narzędziem, by pokazać jak potężny jest (i jak potężny może stać się) reinforcement learning. A potencjał wybiega zdecydowanie poza gry.
Jeżeli interesujecie się szachami i sztuczną inteligencją, sprawdźcie dodatkowe materiały (w języku angielskim). Możecie z nich dowiedzieć się wielu konkretów. To publikacja „Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm” oraz artykuł w serwisie Chess24.
Źródło: Chess24, LesserWrong, The Guardian, Gizmodo. Foto: FelixMittermeier/Pixabay (CC0)