Na topie

SI w kilka godzin potrafi opanować grę do (prawie) perfekcji

Autor:

Szef strefy Ciekawostki

więcej artykułów ze strefy:
Ciekawostki

Sztuczna inteligencja z etapu kompletnego amatora na poziom mistrza potrafi wejść już po kilku godzinach treningu. Kolejne osiągnięcie DeepMind.

SI w kilka godzin potrafi opanować grę do (prawie) perfekcji

A A

DeepMind udowodnił niedawno, że sztuczna inteligencja najlepiej nauczy się sama. „Program” tego zespołu wygrał już co mógł w Go, a teraz powtórzył to w szachach i shogi.

Firma DeepMind stworzyła AlphaZero, wykorzystujące tzw. reinforcement learning. Polega to na tym, że „program” zna tylko podstawowe wytyczne (w tym przypadku zasady gry), ale poszczególne taktyki próbuje opracować sam, zamiast kopiować najlepsze ruchy swoich rywali z przeszłości (jak ma to miejsce u typowej sztucznej inteligencji

Czy taka metoda uczenia się jest efektywna? To mało powiedziane. Jak się bowiem okazuje, wystarczyły cztery godziny, by AlphaZero opanowało grę w szachy do tego stopnia, by pokonać „mistrzowski silnik szachowy” Stockfish. Wynik: 72 remisy i ...28 zwycięstw sztucznej inteligencji od DeepMind. Dodajmy, że by wygrać w shogi wystarczyły 2 godziny treningu.

Zdania na temat tego, czy jest to aż tak duże osiągnięcie, są podzielone. Pojawiają się głosy, że gra nie była przeprowadzona na sprawiedliwych warunkach (to znaczy, że na wykonanie ruchów było zbyt wiele czasu, a moc obliczeniowa dana jednemu i drugiemu „zawodnikowi” nie była równa). Nawet jednak jeśli AlphaZero nie jest jeszcze lepsze niż Stockfish, jest bardzo dobrym narzędziem, by pokazać jak potężny jest (i jak potężny może stać się) reinforcement learning. A potencjał wybiega zdecydowanie poza gry.

Jeżeli interesujecie się szachami i sztuczną inteligencją, sprawdźcie dodatkowe materiały (w języku angielskim). Możecie z nich dowiedzieć się wielu konkretów. To publikacja „Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm” oraz artykuł w serwisie Chess24.

Źródło: Chess24, LesserWrong, The Guardian, Gizmodo. Foto: FelixMittermeier/Pixabay (CC0)

Odsłon: 6343 Skomentuj newsa
Komentarze

21

Udostępnij
  1. Hello
    Oceń komentarz:

    1    

    Opublikowano: 2017-12-09 18:59

    Proszę AI (samo ucząca się sieć neuronowa) w 500 linijkach kodu chodząca w każdej przeglądarce rozwala grę FlappyBird w kilkudziesięciu permutacjach:
    https://xviniette.github.io/FlappyLearning/

    Kod tutaj: https://github.com/xviniette/FlappyLearning

    Skomentuj

    1. kitamo
      Oceń komentarz:

      1    

      Opublikowano: 2017-12-10 19:48

      tylko ze flappy bird to prosta gra i czlowiek nie polegnie na niej ze wzgledu na stopien skomplikowania tylko na blad percepcji - bardziej popelni blad motoryczny a nie logicznego myslenia.
      W takich przypadkach owszem latwo jest nauczyc maszyne jak ma wygrac.

      Trudniej juz robi sie tam gdzie logiczne myslenie u czlowieka potrafi skrocic proces uczenia się nowych rzeczy. Bo tu wlasnie chodzi o nowe rzeczy ktore ludzie potrafia poznawac za pomoca juz wczesniej poznanych doswiadczen itp.
      Nie musisz smakować gówna by wiedzieć że jest niejadalne - komputer musial by sie tego nauczyc.

      Skomplikowana sprawa ale owszem jest to juz jakies AI

      Skomentuj

  2. Gatts-25
    Oceń komentarz:

    0    

    Opublikowano: 2017-12-09 20:35

    Nowoczesne gry to będzie wyzwanie.Nie dość ,że będzie co raz lepiej odzwierciedlały rzeczywistość pod względem zniszczeń , ran ,wpływu naszych zachowań i wyborów także będziemy mieli najwyższy poziom trudności nie przeciwko przeciwnikowi ,który jest kierowany przez człowieka ale właśnie przez taką sztuczną inteligencję.
    Wiele osób mówi ,że osiągamy kres Krzemu i jest trochę w tym prawdy ale gdy spojrzy się na skok ilości tranzystorów mieszczących się na mm2 przechodząc z 28nm na 14nm/16nm i jaki skok się dokona niedługo z 14nm na 7nm to nawet nie ma co porównywać.
    Przejście z 28nm na 14nm dało przyrost tranzystorów na poziomie 25millionów tranzystorów na mm2 zaś teraz to będzie sporo ponad 70milionów tranzystorów na mm2.
    Ogarniając te liczby można dojść do wniosku ,że skok sztucznej inteligencji wraz ze wzrostem mocy obliczeniowej będzie ogromny.
    To jest tak dużo ,że SMARTFONY z SOC wykonanym w litografii 5nm od SAMSUNGA będą miały moc obliczeniową przekraczającą to co sobą prezentuje teraz XBOX ONE X a taki układ możemy zobaczyć już w 2020roku z EXYNOSEM.
    Od 2012 roku do początku 2017 roku mieliśmy zastój ale teraz wszystko się zmieni a firmą ,która wywołała taki ruch w rynku to SAMSUNG i nawet takie TSMC by nie zostać z tyłu robi to samo.

    Skomentuj

  3. GGrzegorz
    Oceń komentarz:

    2    

    Opublikowano: 2017-12-09 20:59

    Jako stary ramol, który przygodę z komputerami rozpoczął od ZX Spectrum, trochę boję sie zachłystywaniem się SI...
    Moje obawy budzi wyłącznie jedna cecha sztucznej inteligencji - brak refleksji.
    Gdyby w 1962 roku to SI decydowałoby zamiast JFK/Chruszczow (w ogromnym uproszczeniu), nie byłoby nas...
    To jeden aspekt.
    Drugi... Czy w szachach, Go, czy w każdej innej grze na prawdę chodzi o jak najszybsze dojście do poziomu mistrzowskiego?
    Na prawdę?

    Skomentuj

    1. Sharimsejn
      Oceń komentarz:

      1    

      Opublikowano: 2017-12-09 23:51

      W grach chodzi o dobrą zabawę. Jednak ja się dobrze bawię osiągając coraz lepsze wyniki w różnych grach. W niektórych gorsze przez brak czasu, a w innych lepsze. Bieganie w grach multiplayer dla samej frajdy żeby pozwiedzać albo porobić sobie jaja mnie nie kręci albo kręciło i szybko się znudziło.

      Skomentuj

  4. brigthmight
    Oceń komentarz:

    -2    

    Opublikowano: 2017-12-09 22:20

    Tutaj po prostu mamy sprytny algorytm napisany w konkretnym celu. Nazywanie tego SI to duze naduzycie. Kazda gra oparta jest na zestawie ograniczonych regul. Mozna napisac algorytm ktory w obrebie tych regul bedzie sie "uczyl". To takie zamkniete pudelko, zadne SI. SI to byloby wtedy jakby samo wymislilo gre, samo stworzylo program i samo decydowalo o tym co bedzie robic pozniej. Poki co SI nie ma i niepredko bedzie, mamy tylko algorytmy wykorzystujace coraz wieksza moc obliczeniowa maszyn, to wszystko.

    Skomentuj

    1. Leader86
      Oceń komentarz:

      0    

      Opublikowano: 2017-12-10 06:45

      Nie masz zielonego pojecia o algorytmach Si/ML czy DL.

      Dlaczego wiec sie wypowiadasz i do tego piszesz kompletne bzdury?

      SI to nazwa potoczna tylko.

      Skomentuj

      1. brigthmight
        Oceń komentarz:

        -2    

        Opublikowano: 2017-12-10 12:47

        Algorytm bedzie algorytmem ze sztuczna inteligencja nie ma to nic wspolnego. Ich autorzy naduzywaja sformulowania "sztuczna inteligencja". Nie istnieje dzisiaj SI i niepredko powstanie.

        Skomentuj

  5. anemus
    Oceń komentarz:

    1    

    Opublikowano: 2017-12-10 04:51

    Cóż, co to ma wspólnego z inteligencją? To przetwarzanie wzorców wg ściśle określonych reguł.
    AlphaZero ma sporo czasu i dużą moc na przetworzenie wszystkich wzorców i dopasowanie do nich wariantów odpowiedzi, szczególnie jak gra sam ze sobą. Jak gra z człowiekiem, to ten nawet po parunastu pojedynkach nie wie nic o taktyce przeciwnika, choć tzw SI miała sporo czasu i mocy na przetworzenie wszelkich wariantów strategii w tym ww zawodnika (nawet jak się na tym nie opierała - sama też musiała na taki wariant wpaść).

    Skomentuj

    1. brigthmight
      Oceń komentarz:

      -1    

      Opublikowano: 2017-12-10 12:50

      Dokladnie ze sztuczna inteligencja nic wspolnego to nie ma. Jedyna inteligencja jaka tam wystapila to autora algorytmu.

      Skomentuj

    2. baca130
      Oceń komentarz:

      1    

      Opublikowano: 2017-12-10 16:16

      Określone reguły miał ponieważ nie miał wymyślić gry w szachy, tylko nauczyć jak się w nie gra.

      Skomentuj

    3. rulax
      Oceń komentarz:

      0    

      Opublikowano: 2017-12-11 08:40

      Niby ok, ale... "Sztuczna inteligencja" dostanie zadanie: poprawić jakość benczmarkowego forum. Włamuje się do sieci -> robi podejrzaną operację na Twoim koncie bankowym -> idziesz do więzienia bez dostępu do internetu. Refleksji/inteligencji brak. Zadanie wykonane. To, że nie jest świadoma wcale nie znaczy, że nie jest groźna.

      Skomentuj

  6. PawelSalsa
    Oceń komentarz:

    2    

    Opublikowano: 2017-12-10 16:00

    Nawet jezeli nie ma to nic ze sztuczna inteligencja to nie o to tutaj chodzi. Chodzi o fakt ze program byl w stanie przyswoic sobie w ciagu 4 godzin wiedze szachowa ktorej przyswojenie ludzia zajelo setki lat a intempletacja tej wiedzy DO silnikow szachowych kolejnych paredziesiat lat. Stockfish byl w wersji 8 , ubiegloroczny zwyciezca mistrzostw swiata silnikow szachowych. Sam silnik jest rozwijany od dobrych 10-12 lat przez grupe programistow, a kod jest open source kazdy wiec moze dolozyc cos os siebie. To jest olbrzymi wyczyn szczegolnie jezeli wezmiemy pod uwage skale porazki; 72-28. To w swiecie silnikow szachowychg jest poprostu NOKAUT! Tam licza sie pojedyncze zwyciestwa i na np 100 parti gdy wynik osyluje np 55-45 mowi sie o duzej porazce, natomist przy takiej skali to jest to poprostu KLESKA! Tym bardziej ze stockfish gral na 64 rdzeniach i mial minute na kazdy ruch, to olbrzymia moc obiczeniowa jak na silnik szachowy! Poogladajcie sobie kanaly szachowe na youtube, szachisci zachwyceni sa stylem w jakim deep mind ogral stockfisha i mowia o nowej erze w szachach, samouczacych sie algorytmach krtore moga pchnac ludzkosc o lata swietlne naprzod!!

    Skomentuj

  7. baca130
    Oceń komentarz:

    1    

    Opublikowano: 2017-12-10 16:08

    Co za bzdury piszecie, może w szachach i shogi da się przeprowadzić symulacje wszystkich posunięć ale już w takim Go gdzie możliwości jest więcej niż gwiazd we wszechświecie to już nie. Tam bez "wymyślenia" dobrej strategii nie ograsz mistrzów z 9 dan.

    Inteligencją jet zdolność do postrzegania, analizy i adaptacji do zmian otoczenia. Zdolność rozumienia, uczenia się oraz wykorzystywania posiadanej wiedzy i umiejętności w różnych sytuacjach.

    Oczywiście SI nie można przedstawiać w tej samej kategorii co ludzkiej, ale dla mnie te określenie jest trafne bo idealnie wpasowuje się w definicje inteligencji. Nie ważne czy to jest krzem i "złożone algorytmy", dopóki uczy się na swoich błędach, analizuje poczynania przeciwnika, uczy i wykorzystuje tą wiedzę jest to inteligencja.

    Przy określeniu inteligencji nie kieruj się ludźmi jako wzorzec i nabierz do tego trochę dystansu.

    Skomentuj

    1. baca130
      Oceń komentarz:

      1    

      Opublikowano: 2017-12-10 16:11

      Ed: to było głównie do brigthmight.

      Skomentuj

  8. ryhard
    Oceń komentarz:

    -1    

    Opublikowano: 2017-12-10 23:00

    Widzę że dajecie się łapać na bajki o sztucznej inteligencji ha ha ha. Fakt, można nauczyć małpę naprawdę wielu rzeczy i będzie ona wykonywać je całkiem sprawnie ale o inteligencji choć by na poziomie komórkowym mowy być nie może. Inteligencja to nie zdolność uczenia się choć Deep Minde próbuje Wam to wmówić i łykacie to jak leszcze ha ha ha.

    Skomentuj Historia edycji

  9. ryhard
    Oceń komentarz:

    -4    

    Opublikowano: 2017-12-10 23:31

    Ludzie czytanie nie boli więc poczytajcie w necie prawdę o "sztucznej inteligencji" ;-). "Żadna sztuczna maszyna nie potrafi też wykonywać więcej niż jednej czynności. Heliograf nie gra w go, a AlphaGo nie prowadzi samochodu. Nie posiada też żadnych własnych motywacji poza nadanymi mu przez twórców ani nie podejmuje trudnych decyzji, nie znając ich celu." https://www.ted.com/talks/john_searle_our_shared_condition_consciousness#t-230051
    - Ludzie nie mają zielonego pojęcia czym jest świadomość ale chwalą się wymyśleniem sztucznej inteligencji. Żałosne ze ktoś w to wierzy może wierzyć ;-).

    Skomentuj

    1. Foxy the Pirate
      Oceń komentarz:

      2    

      Opublikowano: 2017-12-11 10:18

      Żałosne jest to, że nie potrafisz jednego zdania w języku polskim napisać poprawnie.

      Skomentuj

  10. fiLEMONs
    Oceń komentarz:

    0    

    Opublikowano: 2017-12-11 12:05

    A wszyscy i tak czekamy aż przeciwnicy 'AI' z FPSów będą w końcu myśleć.

    Skomentuj

  11. TheMaverickMX
    Oceń komentarz:

    0    

    Opublikowano: 2017-12-11 14:17

    Chciałbym zobaczyć kiedyś turniej w CS GO w którym po jednej stronie byłyby boty sterowane przez AlphaZero, a po drugiej jakaś zawodową drużynę :P

    Skomentuj

    1. sebmania
      Oceń komentarz:

      1    

      Opublikowano: 2017-12-11 15:15

      https://www.youtube.com/watch?v=92tn67YDXg0

      Może nie cs:go ale silnik Ai w Docie 2

      Skomentuj

Dodaj komentarz

Przy komentowaniu prosimy o przestrzeganie netykiety i regulaminu.

Aby dodać komentarz musisz być zalogowany!