Nauka

SI w kilka godzin potrafi opanować grę do (prawie) perfekcji

przeczytasz w 1 min.

Sztuczna inteligencja z etapu kompletnego amatora na poziom mistrza potrafi wejść już po kilku godzinach treningu. Kolejne osiągnięcie DeepMind.

DeepMind udowodnił niedawno, że sztuczna inteligencja najlepiej nauczy się sama. „Program” tego zespołu wygrał już co mógł w Go, a teraz powtórzył to w szachach i shogi.

Firma DeepMind stworzyła AlphaZero, wykorzystujące tzw. reinforcement learning. Polega to na tym, że „program” zna tylko podstawowe wytyczne (w tym przypadku zasady gry), ale poszczególne taktyki próbuje opracować sam, zamiast kopiować najlepsze ruchy swoich rywali z przeszłości (jak ma to miejsce u typowej sztucznej inteligencji

Czy taka metoda uczenia się jest efektywna? To mało powiedziane. Jak się bowiem okazuje, wystarczyły cztery godziny, by AlphaZero opanowało grę w szachy do tego stopnia, by pokonać „mistrzowski silnik szachowy” Stockfish. Wynik: 72 remisy i ...28 zwycięstw sztucznej inteligencji od DeepMind. Dodajmy, że by wygrać w shogi wystarczyły 2 godziny treningu.

Zdania na temat tego, czy jest to aż tak duże osiągnięcie, są podzielone. Pojawiają się głosy, że gra nie była przeprowadzona na sprawiedliwych warunkach (to znaczy, że na wykonanie ruchów było zbyt wiele czasu, a moc obliczeniowa dana jednemu i drugiemu „zawodnikowi” nie była równa). Nawet jednak jeśli AlphaZero nie jest jeszcze lepsze niż Stockfish, jest bardzo dobrym narzędziem, by pokazać jak potężny jest (i jak potężny może stać się) reinforcement learning. A potencjał wybiega zdecydowanie poza gry.

Jeżeli interesujecie się szachami i sztuczną inteligencją, sprawdźcie dodatkowe materiały (w języku angielskim). Możecie z nich dowiedzieć się wielu konkretów. To publikacja „Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm” oraz artykuł w serwisie Chess24.

Źródło: Chess24, LesserWrong, The Guardian, Gizmodo. Foto: FelixMittermeier/Pixabay (CC0)

Komentarze

22
Zaloguj się, aby skomentować
avatar
Komentowanie dostępne jest tylko dla zarejestrowanych użytkowników serwisu.
  • avatar
    GGrzegorz
    2
    Jako stary ramol, który przygodę z komputerami rozpoczął od ZX Spectrum, trochę boję sie zachłystywaniem się SI...
    Moje obawy budzi wyłącznie jedna cecha sztucznej inteligencji - brak refleksji.
    Gdyby w 1962 roku to SI decydowałoby zamiast JFK/Chruszczow (w ogromnym uproszczeniu), nie byłoby nas...
    To jeden aspekt.
    Drugi... Czy w szachach, Go, czy w każdej innej grze na prawdę chodzi o jak najszybsze dojście do poziomu mistrzowskiego?
    Na prawdę?
    • avatar
      PawelSalsa
      2
      Nawet jezeli nie ma to nic ze sztuczna inteligencja to nie o to tutaj chodzi. Chodzi o fakt ze program byl w stanie przyswoic sobie w ciagu 4 godzin wiedze szachowa ktorej przyswojenie ludzia zajelo setki lat a intempletacja tej wiedzy DO silnikow szachowych kolejnych paredziesiat lat. Stockfish byl w wersji 8 , ubiegloroczny zwyciezca mistrzostw swiata silnikow szachowych. Sam silnik jest rozwijany od dobrych 10-12 lat przez grupe programistow, a kod jest open source kazdy wiec moze dolozyc cos os siebie. To jest olbrzymi wyczyn szczegolnie jezeli wezmiemy pod uwage skale porazki; 72-28. To w swiecie silnikow szachowychg jest poprostu NOKAUT! Tam licza sie pojedyncze zwyciestwa i na np 100 parti gdy wynik osyluje np 55-45 mowi sie o duzej porazce, natomist przy takiej skali to jest to poprostu KLESKA! Tym bardziej ze stockfish gral na 64 rdzeniach i mial minute na kazdy ruch, to olbrzymia moc obiczeniowa jak na silnik szachowy! Poogladajcie sobie kanaly szachowe na youtube, szachisci zachwyceni sa stylem w jakim deep mind ogral stockfisha i mowia o nowej erze w szachach, samouczacych sie algorytmach krtore moga pchnac ludzkosc o lata swietlne naprzod!!
      • avatar
        Hello
        1
        Proszę AI (samo ucząca się sieć neuronowa) w 500 linijkach kodu chodząca w każdej przeglądarce rozwala grę FlappyBird w kilkudziesięciu permutacjach:
        https://xviniette.github.io/FlappyLearning/

        Kod tutaj: https://github.com/xviniette/FlappyLearning
        • avatar
          Konto usunięte
          1
          Cóż, co to ma wspólnego z inteligencją? To przetwarzanie wzorców wg ściśle określonych reguł.
          AlphaZero ma sporo czasu i dużą moc na przetworzenie wszystkich wzorców i dopasowanie do nich wariantów odpowiedzi, szczególnie jak gra sam ze sobą. Jak gra z człowiekiem, to ten nawet po parunastu pojedynkach nie wie nic o taktyce przeciwnika, choć tzw SI miała sporo czasu i mocy na przetworzenie wszelkich wariantów strategii w tym ww zawodnika (nawet jak się na tym nie opierała - sama też musiała na taki wariant wpaść).
          • avatar
            baca130
            1
            Co za bzdury piszecie, może w szachach i shogi da się przeprowadzić symulacje wszystkich posunięć ale już w takim Go gdzie możliwości jest więcej niż gwiazd we wszechświecie to już nie. Tam bez "wymyślenia" dobrej strategii nie ograsz mistrzów z 9 dan.

            Inteligencją jet zdolność do postrzegania, analizy i adaptacji do zmian otoczenia. Zdolność rozumienia, uczenia się oraz wykorzystywania posiadanej wiedzy i umiejętności w różnych sytuacjach.

            Oczywiście SI nie można przedstawiać w tej samej kategorii co ludzkiej, ale dla mnie te określenie jest trafne bo idealnie wpasowuje się w definicje inteligencji. Nie ważne czy to jest krzem i "złożone algorytmy", dopóki uczy się na swoich błędach, analizuje poczynania przeciwnika, uczy i wykorzystuje tą wiedzę jest to inteligencja.

            Przy określeniu inteligencji nie kieruj się ludźmi jako wzorzec i nabierz do tego trochę dystansu.
            • avatar
              Gatts-25
              0
              Nowoczesne gry to będzie wyzwanie.Nie dość ,że będzie co raz lepiej odzwierciedlały rzeczywistość pod względem zniszczeń , ran ,wpływu naszych zachowań i wyborów także będziemy mieli najwyższy poziom trudności nie przeciwko przeciwnikowi ,który jest kierowany przez człowieka ale właśnie przez taką sztuczną inteligencję.
              Wiele osób mówi ,że osiągamy kres Krzemu i jest trochę w tym prawdy ale gdy spojrzy się na skok ilości tranzystorów mieszczących się na mm2 przechodząc z 28nm na 14nm/16nm i jaki skok się dokona niedługo z 14nm na 7nm to nawet nie ma co porównywać.
              Przejście z 28nm na 14nm dało przyrost tranzystorów na poziomie 25millionów tranzystorów na mm2 zaś teraz to będzie sporo ponad 70milionów tranzystorów na mm2.
              Ogarniając te liczby można dojść do wniosku ,że skok sztucznej inteligencji wraz ze wzrostem mocy obliczeniowej będzie ogromny.
              To jest tak dużo ,że SMARTFONY z SOC wykonanym w litografii 5nm od SAMSUNGA będą miały moc obliczeniową przekraczającą to co sobą prezentuje teraz XBOX ONE X a taki układ możemy zobaczyć już w 2020roku z EXYNOSEM.
              Od 2012 roku do początku 2017 roku mieliśmy zastój ale teraz wszystko się zmieni a firmą ,która wywołała taki ruch w rynku to SAMSUNG i nawet takie TSMC by nie zostać z tyłu robi to samo.
              • avatar
                Konto usunięte
                -1
                Widzę że dajecie się łapać na bajki o sztucznej inteligencji ha ha ha. Fakt, można nauczyć małpę naprawdę wielu rzeczy i będzie ona wykonywać je całkiem sprawnie ale o inteligencji choć by na poziomie komórkowym mowy być nie może. Inteligencja to nie zdolność uczenia się choć Deep Minde próbuje Wam to wmówić i łykacie to jak leszcze ha ha ha.
                • avatar
                  brigthmight
                  -2
                  Tutaj po prostu mamy sprytny algorytm napisany w konkretnym celu. Nazywanie tego SI to duze naduzycie. Kazda gra oparta jest na zestawie ograniczonych regul. Mozna napisac algorytm ktory w obrebie tych regul bedzie sie "uczyl". To takie zamkniete pudelko, zadne SI. SI to byloby wtedy jakby samo wymislilo gre, samo stworzylo program i samo decydowalo o tym co bedzie robic pozniej. Poki co SI nie ma i niepredko bedzie, mamy tylko algorytmy wykorzystujace coraz wieksza moc obliczeniowa maszyn, to wszystko.
                  • avatar
                    Konto usunięte
                    -4
                    Ludzie czytanie nie boli więc poczytajcie w necie prawdę o "sztucznej inteligencji" ;-). "Żadna sztuczna maszyna nie potrafi też wykonywać więcej niż jednej czynności. Heliograf nie gra w go, a AlphaGo nie prowadzi samochodu. Nie posiada też żadnych własnych motywacji poza nadanymi mu przez twórców ani nie podejmuje trudnych decyzji, nie znając ich celu." https://www.ted.com/talks/john_searle_our_shared_condition_consciousness#t-230051
                    - Ludzie nie mają zielonego pojęcia czym jest świadomość ale chwalą się wymyśleniem sztucznej inteligencji. Żałosne ze ktoś w to wierzy może wierzyć ;-).
                    • avatar
                      rasiaknorris1
                      0
                      W cs niech zagra :)
                      • avatar
                        fiLEMONs
                        0
                        A wszyscy i tak czekamy aż przeciwnicy 'AI' z FPSów będą w końcu myśleć.
                        • avatar
                          TheMaverickMX
                          0
                          Chciałbym zobaczyć kiedyś turniej w CS GO w którym po jednej stronie byłyby boty sterowane przez AlphaZero, a po drugiej jakaś zawodową drużynę :P