Nauka

Google wie kto mówi i wie co mówi

Wojciech Kulik | Redaktor serwisu benchmark.pl
7 komentarzy Dyskutuj z nami

Naukowcy z Google opracowali program oparty na sztucznej inteligencji, który potrafi zidentyfikować i wyodrębnić głos spośród innych. Wyniki są naprawdę imponujące, a równocześnie całkiem przerażające.

Przyjęcie, na którym każdy kogoś zna, jeden wielki chaos na dworcu kolejowym czy burzliwa debata na tematy światopoglądowe. Są sytuacje i miejsca, w których ilość dźwięków jest tak duża, że prawie niemożliwe jest wyizolowanie czyjegoś głosu (i skupienie się tylko na nim), a co dopiero zrozumienie, co ten ktoś ma do przekazania. …Chyba że jest się sztuczną inteligencją od Google.

Podczas gdy dla człowieka (dla którego głos jest naturalnym nośnikiem komunikacyjnym) rozróżnianie dźwięków jest trudne, dla maszyny czy programu było do tej pory praktycznie nieosiągalne. O tym większym sukcesie może więc mówić firma Google, która zdołała nauczyć swój twór zwracania uwagi na pewne elementy wypowiedzi, dzięki czemu potrafi on całkowicie wyizolować tło (wraz z innymi osobami).

O co chodzi? Spójrzcie na ten materiał:

Albo ten:

Jak widać, system stworzony przez Google radzi sobie wyśmienicie identyfikacją i wyodrębnieniem danego mówcy oraz wyciszeniem wszystkiego, co nie jest jego głosem. W taki sam sposób można pozbyć się wszelkiego rodzaju szumów z otoczenia – tak jak na tym filmie:

Jak osiągnięty został tak wyśmienity efekt? Naukowcy wykorzystali dość nietypową, ale genialną metodę szkolenia SI. Opiera ona swoje działanie nie tylko na dźwięku, ale też obrazie (starając się odkryć źródła pochodzenia danych głosów, analizując na przykład mimikę mówcy). 

Google SI głos

Oczywiście w zależności od rozmiaru różnic w głosach poszczególnych osób, rezultat może być lepszy lub gorszy, ale i tak jest to imponujące… i przerażające zarazem. Nie trzeba być miłośnikiem teorii spiskowych, by wymyślić choćby kilka (niekoniecznie pozytywnych) zastosowań dla tego rozwiązania.

Źródło: Google Research Blog, Android Police. Ilustracja: geralt/Pixabay (CC0)

Komentarze

7
Zaloguj się, aby skomentować
avatar
Dodaj
Komentowanie dostępne jest tylko dla zarejestrowanych użytkowników serwisu.
  • avatar
    Kenjiro
    Nie rozumiem przerażenia, przecież zastosowane podejście jest bardzo logiczne i wymaga po prostu odpowiedniej technologii, więc dla mnie było oczywistym, że się pojawi. Jedyną zagadką było - kiedy.
    2
  • avatar
    Chiny_X
    Przecież telefon już od dawna podsłuchuje użytkownika.
    Zrobiliśmy eksperyment z żoną i przy zablokowanych zaczęliśmy nagminnie rozmawiać o jodze przez cały dzień.
    Dwa dni później na pewnym portalu udostępniającym treści video którego aplikacje mieliśmy zainstalowane w sugestiach mnóstwo filmików tematycznych.
    Więc żadna to nowość.
    2