Na topie

Google wie kto mówi i wie co mówi

Autor:

Szef strefy Ciekawostki

więcej artykułów ze strefy:
Ciekawostki

Kategoria: Ciekawostki Nauka Tematyka: sztuczna inteligencja Producenci: Google

Naukowcy z Google opracowali program oparty na sztucznej inteligencji, który potrafi zidentyfikować i wyodrębnić głos spośród innych. Wyniki są naprawdę imponujące, a równocześnie całkiem przerażające.

  • Google wie kto mówi i wie co mówi
A A

Przyjęcie, na którym każdy kogoś zna, jeden wielki chaos na dworcu kolejowym czy burzliwa debata na tematy światopoglądowe. Są sytuacje i miejsca, w których ilość dźwięków jest tak duża, że prawie niemożliwe jest wyizolowanie czyjegoś głosu (i skupienie się tylko na nim), a co dopiero zrozumienie, co ten ktoś ma do przekazania. …Chyba że jest się sztuczną inteligencją od Google.

Podczas gdy dla człowieka (dla którego głos jest naturalnym nośnikiem komunikacyjnym) rozróżnianie dźwięków jest trudne, dla maszyny czy programu było do tej pory praktycznie nieosiągalne. O tym większym sukcesie może więc mówić firma Google, która zdołała nauczyć swój twór zwracania uwagi na pewne elementy wypowiedzi, dzięki czemu potrafi on całkowicie wyizolować tło (wraz z innymi osobami).

O co chodzi? Spójrzcie na ten materiał:

Albo ten:

Jak widać, system stworzony przez Google radzi sobie wyśmienicie identyfikacją i wyodrębnieniem danego mówcy oraz wyciszeniem wszystkiego, co nie jest jego głosem. W taki sam sposób można pozbyć się wszelkiego rodzaju szumów z otoczenia – tak jak na tym filmie:

Jak osiągnięty został tak wyśmienity efekt? Naukowcy wykorzystali dość nietypową, ale genialną metodę szkolenia SI. Opiera ona swoje działanie nie tylko na dźwięku, ale też obrazie (starając się odkryć źródła pochodzenia danych głosów, analizując na przykład mimikę mówcy). 

Google SI głos

Oczywiście w zależności od rozmiaru różnic w głosach poszczególnych osób, rezultat może być lepszy lub gorszy, ale i tak jest to imponujące… i przerażające zarazem. Nie trzeba być miłośnikiem teorii spiskowych, by wymyślić choćby kilka (niekoniecznie pozytywnych) zastosowań dla tego rozwiązania.

Źródło: Google Research Blog, Android Police. Ilustracja: geralt/Pixabay (CC0)

Odsłon: 4254 Skomentuj newsa
Komentarze

7

Udostępnij
  1. Kenjiro
    Oceń komentarz:

    2    

    Opublikowano: 2018-04-16 12:37

    Nie rozumiem przerażenia, przecież zastosowane podejście jest bardzo logiczne i wymaga po prostu odpowiedniej technologii, więc dla mnie było oczywistym, że się pojawi. Jedyną zagadką było - kiedy.

    Skomentuj

    1. Skaza
      Oceń komentarz:

      8    

      Opublikowano: 2018-04-16 13:36


      Wydaje mi się, że pytanie nie powinno dotyczyć czasu pojawienia się takiej technologii, a jej przeznaczenia. Można również zapytać, dlaczego niektóre aplikacje z Google Play żądają dostępu do mikrofonu, aparatu i wielu innych elementów, choć ich funkcjonalność nie jest w żaden sposób z tymi elementami związana.

      Skomentuj

      1. mesjan
        Oceń komentarz:

        1    

        Opublikowano: 2018-04-17 08:26

        Wyszukiwarka googla wykorzystuje mikrofon do wyszukiwania głosowego, tłumacz googla wykorzystuje aparat do tłumaczenia tekstu na ekranie najeżdżając kamerą na tekst. Tworząc aplikację na telefon która choćby muśnie jakiegoś czujnika który nie został wymieniony w regulaminie może zakończyć się sprawą w sądzie i wysokim odszkodowaniem.

        Skomentuj Historia edycji

    2. owatanka
      Oceń komentarz:

      2    

      Opublikowano: 2018-04-16 15:30

      Jak na moje to za****ste wyczuj to tesciowa ci prawi farmazony nad uchem a ty wyciszasz jej skrzeczenie i spokojnie ogladasz sport :O

      Skomentuj

    3. sebastianzola
      Oceń komentarz:

      1    

      Opublikowano: 2018-04-16 19:05

      A ja rozumiem przerażenie. Dzięki temu można podsłuchiwać co mówi dana osobą w tłumie, na imprezie. Oczywiście zależy do czego będzie to wykorzystane ale patrz zawsze w dwie strony.

      Skomentuj

  2. Chiny_X
    Oceń komentarz:

    2    

    Opublikowano: 2018-04-16 15:59

    Przecież telefon już od dawna podsłuchuje użytkownika.
    Zrobiliśmy eksperyment z żoną i przy zablokowanych zaczęliśmy nagminnie rozmawiać o jodze przez cały dzień.
    Dwa dni później na pewnym portalu udostępniającym treści video którego aplikacje mieliśmy zainstalowane w sugestiach mnóstwo filmików tematycznych.
    Więc żadna to nowość.

    Skomentuj

    1. michalje
      Oceń komentarz:

      1    

      Opublikowano: 2018-04-16 19:34

      dla ignorantów to jest nowość, albo coś co mają po prostu gdzieś. ~90% społeczeństwa uważa, że i tak nie ma nic do ukrycia więc im to rybka.. ehh

      Każdy taki ignorant zmienia podejście, gdy pytam go czy miałby coś przeciwko, żebym zamontował w jego domu kamerkę i sobie oglądał co robi (w końcu nie ma nic do ukrycia). Ale kamerka w laptopie takiemu nie przeszkadza i dziwi go po co zaklejam taśmą swoja. Ludzie to debile

      Skomentuj

Dodaj komentarz

Przy komentowaniu prosimy o przestrzeganie netykiety i regulaminu.

Aby dodać komentarz musisz być zalogowany!