Tłumacz Google obsługuje nieco ponad 130 języków - jest to niewiele, patrząc na to, że istnieje ich ponad 7000. Firma Google, chcąc zaoferować możliwość porozumiewania się w Internecie miliardom ludzi, zaprezentowała uniwersalny system tłumaczeń, oparty na sztucznej inteligencji.

Uniwersalny system tłumaczenia mowy Google

Google, podczas prezentacji nowych produktów AI, ogłosiło projekt opracowania modelu sztucznej inteligencji, który docelowo będzie obsługiwał 1000 najczęściej używanych języków świata. Będzie to zatem znacznie więcej, niż w przypadku systemu tłumaczenia mowy, którym chwaliła się firma Meta - NLLB-200 obsługuje ich 200. Jednak zarówno w jednym, jak i drugim przypadku chodzi przede wszystkim o ułatwienie dostępu ludziom z całego świata do informacji w Internecie. Jeff Dean z Google Research w swoim wpisie na blogu Google zaznaczył, iż:

Na całym świecie mówi się ponad 7000 języków, a tylko kilka z nich jest dziś dobrze reprezentowanych w Internecie. Oznacza to, że tradycyjne podejścia do uczenia modeli językowych na tekstach z Internetu nie są w stanie uchwycić różnorodności tego, jak komunikujemy się na całym świecie. Historycznie stanowiło to przeszkodę w realizacji naszej misji, aby informacje na całym świecie były powszechnie dostępne i użyteczne.

Projekt Google zapewni miliardom ludzi na całym świecie możliwość lepszej integracji w Internecie z innymi użytkownikami. Jak podkreśla Jeff Dean, będzie to przedsięwzięcie na wiele lat, jednak opracowywana technologia zmienia się w błyskawicznym tempie, co daje nowe możliwości. Firma opracowała już Uniwersalny Model Mowy, który został wyszkolony w ponad 400 językach, co na ten moment czyni go największym tego typu narzędziem.

Model tłumaczeń będzie miał wiele zastosowań

Google stara się pozyskiwać reprezentatywne dane dotyczące mowy i efektem tego jest niedawno ogłoszone rozszerzenie przekształcania mowy na tekst w kolejnych 9 językach afrykańskich. W Azji Południowej firma współpracuje z samorządami lokalnymi, organizacjami pozarządowymi oraz instytucjami akademickimi, aby zebrać reprezentatywne próbki audio ze wszystkich dialektów oraz języków regionu.

Bezpośrednich planów dotyczących zastosowania funkcjonalności modelu tłumaczeń nie ma – gigant technologiczny oczekuje, że będzie miał on szereg zastosowań w produktach Google, od Tłumacza Google, po napisy na YouTube i nie tylko. Jak podkreśla Zoubin Ghahramani, wiceprezes ds. badań w Google AI w wywiadzie dla serwisu The Verge:

Jedną z naprawdę interesujących rzeczy w dużych modelach językowych i ogólnie w badaniach językowych jest to, że mogą wykonywać wiele różnych zadań. Ten sam model języka może zamienić polecenia robota w kod; potrafi rozwiązywać problemy matematyczne; może zrobić tłumaczenie. Naprawdę interesującą rzeczą w modelach językowych jest to, że stają się repozytoriami dużej wiedzy, a badając je na różne sposoby, można uzyskać różne przydatne funkcje.

Nowe produkty AI

Przedstawiciele Google, podczas swojej prezentacji, poinformowali również o nowych badaniach nad modelami przerabiania tekstu na wideo, a także zaprezentowali prototypowego asystenta pisania AI o nazwie Wordcraft. Omówiono też aktualizację aplikacji AI Test Kitchen, która daje użytkownikom ograniczony dostęp do niedopracowanych modeli AI. Transmisja z wydarzenia jest dostępna poniżej:

