Nauka

Sztuczna inteligencja najlepiej nauczy się sama

opublikowano przez Wojciech Kulik w dniu 2017-10-20

Wystarczyło 40 dni, by program AlphaGo Zero (grając sam ze sobą) opanował poziom zaawansowania w go nieosiągalny dotąd dla nikogo.

Słyszeliście pewnie o AlphaGo – to oparty na sztucznej inteligencji program zespołu DeepMind, który opanował sztukę gry w go do tego stopnia, że bez większych problemów wygrał pojedynki z arcymistrzami uznawanymi za najlepszych z najlepszych. Jeśli byliście pod wrażeniem, to musicie wiedzieć, że znalazł się wreszcie jego pogromca – nazywa się… AlphaGo Zero.

AlphaGo Zero również jest programem bazującym na sztucznej inteligencji, ale nieco innego rodzaju. O ile bowiem ten pierwszy uczył się najlepszych ruchów i strategii poprzez toczenie pojedynków z ludzkimi przeciwnikami, tak AlphaGo Zero uczył się sam (tzw. reinforcement learning). Rozgrywał sam ze sobą partię za partią (początkowo nie znał żadnych ruchów – wyłącznie podstawowe zasady gry – ale z czasem uczył się tego, jakie najszybciej i najskuteczniej doprowadzą go do zwycięstwa).

AlphaGo

Tak samouczący się program już po 3 godzinach zaczął grać jak ludzki amator (robiąc jeszcze bardzo proste błędy), a po 19 godzinach miał już wiedzę na temat bardziej zaawansowanych strategii. Po trzech dniach treningu był w stanie pokonać wersję AlphaGo z 2015 roku (tę, która pokonała arcymistrza Lee Sedola) i to wynikiem 100:1. Po trzech tygodniach zrównał się poziomem z wersją, która pokonała wszystkich najlepszych zawodników („Master”). I wreszcie po 40 dniach zdołał wygrać ze wspomnianym „Masterem”.

AlphaGo Zero wykres

Krótko mówiąc: nie trzeba było czekać półtora miesiąca, by program-samouk stał się najlepszym zawodnikiem w go na świecie – lepszym od rozwijanego od lat AlphaGo i ludzkich zawodników z wieloletnim doświadczeniem. Taka sztuczna inteligencja, która nie musi ograniczać się do ludzkiej wiedzy, może pomóc w rozwiązaniu problemów, z którymi do tej pory ludzkość sobie nie poradziła. Taki jest potencjał.

Źródło: DeepMind Blog

marketplace

Komentarze

13
Zaloguj się, żeby skomentować
avatar
Dodaj
Komentowanie dostępne jest tylko dla zarejestrowanych użytkowników serwisu.
  • avatar
    (Morpheus do Neo)

    Na początku 21 wieku ludzkość popadła w samozachwyt, stworzyliśmy "SI". Cyfrową świadomość która...
    Zaloguj się
  • avatar
    ...Byleby ktoś/coś nie wpadło na pomysł przeprowadzenia procesu 'reinforcement learning' na odpowiednio zasobnym systemie posiadającym dostęp do systemów sterujących, odpowiednio powszechnymi, odpowiednio dużymi mechanicznymi urządzeniami z założeniem wyeliminowania problemu o nazwie błąd człowieka bez zakładania wartości życia i wolności samostanowienia ludzi jako nadrzędnej.

    Cos mi się wydaje ze przy tak szybkim procesie, prędzej czy później jakiś zryty dupek dla czystej zabawy odpali taki proces... Tak żeby zobaczyć co się stanie... Wtedy reprezentacje szybkich postępów w nauce sinika AI będziemy mieli szanse zobaczyć w rzeczywistym świecie... Musk ma racje bijąc na alarm...
    Potrzebne są reguły, nadzór i zabezpieczenia. Ale te są mało realne. Wkrótce byle kto będzie mógł odpalać swoje małe testy silników AI…

    Albo to może po prostu ponury piątek jest….
    Zaloguj się
  • avatar
    AI ktore samo sie uczy nie narzuca na siebie ograniczen, jak robimy to my wykorzystujac rozum i nie robi blednych zalozen z gory je odrzucajac, tylko i tak wszystko przetestuje.
  • avatar
    Na razie roboty ledwo widza, sa gluche, nie maja zadnego refleksu i mozna je zwabiac w nieskonczone pulapki, nie spiskuja, nie umia przekupywac ludzi ani klamac, moze sie i ucza ale to potrzeba z 500 lat jeszcze
    Zaloguj się
    -1
  • avatar
    James Cameron wyprzedził swoją epokę o kilkaset lat, ale o tym to będą ludzie rozmawiać za jakieś 200? 300 lat?
  • avatar
    W kółko i krzyżyk bym rozwalił ten program.