Sztuczna inteligencja najlepiej nauczy się sama

20 października 2017przeczytasz w 1 min.

Wystarczyło 40 dni, by program AlphaGo Zero (grając sam ze sobą) opanował poziom zaawansowania w go nieosiągalny dotąd dla nikogo.

Słyszeliście pewnie o AlphaGo – to oparty na sztucznej inteligencji program zespołu DeepMind, który opanował sztukę gry w go do tego stopnia, że bez większych problemów wygrał pojedynki z arcymistrzami uznawanymi za najlepszych z najlepszych. Jeśli byliście pod wrażeniem, to musicie wiedzieć, że znalazł się wreszcie jego pogromca – nazywa się… AlphaGo Zero.

AlphaGo Zero również jest programem bazującym na sztucznej inteligencji, ale nieco innego rodzaju. O ile bowiem ten pierwszy uczył się najlepszych ruchów i strategii poprzez toczenie pojedynków z ludzkimi przeciwnikami, tak AlphaGo Zero uczył się sam (tzw. reinforcement learning). Rozgrywał sam ze sobą partię za partią (początkowo nie znał żadnych ruchów – wyłącznie podstawowe zasady gry – ale z czasem uczył się tego, jakie najszybciej i najskuteczniej doprowadzą go do zwycięstwa).

AlphaGo

Tak samouczący się program już po 3 godzinach zaczął grać jak ludzki amator (robiąc jeszcze bardzo proste błędy), a po 19 godzinach miał już wiedzę na temat bardziej zaawansowanych strategii. Po trzech dniach treningu był w stanie pokonać wersję AlphaGo z 2015 roku (tę, która pokonała arcymistrza Lee Sedola) i to wynikiem 100:1. Po trzech tygodniach zrównał się poziomem z wersją, która pokonała wszystkich najlepszych zawodników („Master”). I wreszcie po 40 dniach zdołał wygrać ze wspomnianym „Masterem”.

AlphaGo Zero wykres

Krótko mówiąc: nie trzeba było czekać półtora miesiąca, by program-samouk stał się najlepszym zawodnikiem w go na świecie – lepszym od rozwijanego od lat AlphaGo i ludzkich zawodników z wieloletnim doświadczeniem. Taka sztuczna inteligencja, która nie musi ograniczać się do ludzkiej wiedzy, może pomóc w rozwiązaniu problemów, z którymi do tej pory ludzkość sobie nie poradziła. Taki jest potencjał.

Źródło: DeepMind Blog

Komentarze

Zaloguj się, aby skomentować

Konto usunięte
2017-10-2017:13
7
(Morpheus do Neo)

Na początku 21 wieku ludzkość popadła w samozachwyt, stworzyliśmy "SI". Cyfrową świadomość która...
batchmax
2017-10-2016:15
2
...Byleby ktoś/coś nie wpadło na pomysł przeprowadzenia procesu 'reinforcement learning' na odpowiednio zasobnym systemie posiadającym dostęp do systemów sterujących, odpowiednio powszechnymi, odpowiednio dużymi mechanicznymi urządzeniami z założeniem wyeliminowania problemu o nazwie błąd człowieka bez zakładania wartości życia i wolności samostanowienia ludzi jako nadrzędnej.

Cos mi się wydaje ze przy tak szybkim procesie, prędzej czy później jakiś zryty dupek dla czystej zabawy odpali taki proces... Tak żeby zobaczyć co się stanie... Wtedy reprezentacje szybkich postępów w nauce sinika AI będziemy mieli szanse zobaczyć w rzeczywistym świecie... Musk ma racje bijąc na alarm...
Potrzebne są reguły, nadzór i zabezpieczenia. Ale te są mało realne. Wkrótce byle kto będzie mógł odpalać swoje małe testy silników AI…

Albo to może po prostu ponury piątek jest….
TomPo75
2017-10-2021:57
1
AI ktore samo sie uczy nie narzuca na siebie ograniczen, jak robimy to my wykorzystujac rozum i nie robi blednych zalozen z gory je odrzucajac, tylko i tak wszystko przetestuje.

Akatzuky
2017-10-2017:07
-1
Na razie roboty ledwo widza, sa gluche, nie maja zadnego refleksu i mozna je zwabiac w nieskonczone pulapki, nie spiskuja, nie umia przekupywac ludzi ani klamac, moze sie i ucza ale to potrzeba z 500 lat jeszcze
KORGAN
2017-10-2100:17
0
James Cameron wyprzedził swoją epokę o kilkaset lat, ale o tym to będą ludzie rozmawiać za jakieś 200? 300 lat?
Console Gaming King
2017-10-2200:13
0
W kółko i krzyżyk bym rozwalił ten program.

Komentarze

Witaj!