Mówienie sztucznej inteligencji „dobra robota!”

Jaki sposób na uczenie sztucznej inteligencji jest najlepszy? Obecnie istnieją dwie szkoły: jedną preferują Google i Elon Musk, drugą – Microsoft.

Wojciech Kulik

1 lipca 2017, 15:43

Ludzie uczą się bardzo efektywnie. Jesteśmy w stanie szybko opanować pewne czynności, ale niestety nie można tego samego powiedzieć o sztucznej inteligencji. Przynajmniej na razie.

„Inteligentne” oprogramowanie i roboty podczas nauki wykorzystują znaną też ludziom metodę prób i błędów. Testują różne sposoby realizacji zadania do tego momentu, aż wykonają je wzorowo. Jest tylko jeden problem: jak najlepiej powiedzieć sztucznej inteligencji, że zrobiła coś tak jak należy?

Odpowiedzi na to pytanie szukają trzy zespoły: współpracujące DeepMind (należący do Google) i OpenAI (założony przez Elona Muska) oraz niezależnie Maluuba (przejęty w tym roku przez Microsoft). Te pierwsze doszły do wniosku, że najlepiej jeśli człowiek będzie „pasterzem”, Maluuba zaś proponuje opracowanie systemu, który pozwoli SI lepiej zrozumieć sytuację bez udziału człowieka.

Czy DeepMind i OpenAI stawiają na zacofane metody? Nie, po prostu inaczej podchodzą do tematu. Otóż prowadzą eksperymenty, w których człowiek za każdym razem wybiera ten lepszy z dwóch filmów przedstawiających wykonanie zadania przez sztuczną inteligencję. Ta ostatnia stara się jednak przeanalizować to, by zrozumieć gdzie robi błąd i czego się wystrzegać.

Tak robią to zespoły DeepMind i OpenAI.

Innymi słowy: dzięki takim eksperymentom sztuczna inteligencja ma zyskać umiejętność przewidywania, co ludzie oceniliby jako dobrze i bezpiecznie wykonane zadania.

Należący do Microsoftu zespół Maluuba poszedł nieco inną drogą, a skuteczność swojego sposobu na uczenie sztucznej inteligencji udowodnił na przykładzie gry Pac-Man. Jego algorytmy osiągnęły maksymalną liczbę punktów, poprawiając dotychczasowy rekord czterokrotnie.

Jak to osiągnięto? Otóż na początku pani Pac-Man poruszała się losowo, nie znając planszy. Z czasem odkrywała, że można zdobywać nagrody i że trzeba unikać duchów. Sztuczna inteligencja wprowadziła więc małe algorytmy w interesujących ją miejscach, które wskazywały optymalny kierunek, aby pani Pac-Man zdobywała jak najwięcej punktów.

Łącznie stworzone zostały 163 algorytmy, które cały czas analizują sytuację na planszy i próbują odgadnąć, jak najlepiej się poruszać, by zdobyć wszystkie nagrody i uniknąć wszystkich przeszkód. Efekt – 100 proc. możliwych do zdobycia punktów – udało się, według zespołu Maluuba, osiągnąć właśnie dzięki rozproszeniu nauki na wiele mniejszych algorytmów.

jest podzielenie materiału na dużo małych elementów.

Czyżby więc tutaj leżała odpowiedź na pytanie, jak powiedzieć sztucznej inteligencji „Dobra robota!”?

Źródło: Quartz, Microsoft, OpenAI. Foto: RobinHiggins/Pixabay (CC0)

Wojciech Kulik