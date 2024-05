W ramach wydarzenia Google Next, gigant technologiczny ogłosił istotne ulepszenia swojego modelu AI, Gemini 1.5 Pro, które znacząco rozszerzają jego możliwości.

Google Gemini to zaawansowany model AI opracowany przez Google, który charakteryzuje się natywnymi możliwościami multimodalnymi. Oznacza to, że został zaprojektowany do jednoczesnego i płynnego przetwarzania wielu rodzajów danych — takich jak tekst, obrazy, audio, wideo i kod — co pozwala na bardziej efektywne wykonywanie złożonych zadań rozumowania i rozwiązywania problemów w różnych dziedzinach.

Jak podaje The Verge, najnowsza aktualizacja wyposaża model w "uszy", umożliwiając mu słuchanie załadowanych plików audio i ekstrahowanie z nich informacji bez konieczności odwoływania się do pisemnych transkryptów. Ta zmiana otwiera nowe perspektywy dla przetwarzania plików dźwiękowych, takich jak zapisy rozmów biznesowych czy dźwięk z filmów.

Gemini 1.5 Pro dostępny publicznie

Google poinformowało również, że po raz pierwszy udostępni Gemini 1.5 Pro szerszej publiczności za pośrednictwem swojej platformy do tworzenia aplikacji AI, Vertex AI. Gemini 1.5 Pro, będący "średniakiem" w rodzinie modeli Gemini, już przewyższa swoimi możliwościami największy i najbardziej zaawansowany model, Gemini Ultra, pod względem wydajności. Nowy model nie wymaga już drobiazgowego dostosowywania, co Google uznaje za znaczący krok naprzód w dostępności i łatwości użycia technologii AI.

Innowacje w innych modelach AI Google'a

Oprócz Gemini 1.5 Pro, Google zapowiedział aktualizacje dla innego dużego modelu AI, Imagen 2, który odpowiada za generowanie obrazów na podstawie tekstu. Nowe funkcje, takie jak inpainting i outpainting, umożliwiają użytkownikom dodawanie lub usuwanie elementów z obrazów. Dodatkowo, Google wprowadziło funkcję cyfrowego znakowania wodnego SynthID, której celem jest oznaczanie obrazów stworzonych przez modele Imagen niezauważalnym dla oka znakiem wodnym, identyfikującym ich pochodzenie.

Odpowiedzi zaktualizowane dzięki Google Search

W nowatorskim posunięciu, jak informuje The Verge, Google testuje sposób na zwiększenie aktualności odpowiedzi swojego AI poprzez integrację z wyszukiwarką Google, co pozwoli na udzielanie odpowiedzi zawierających najświeższe informacje. To ważny krok, biorąc pod uwagę wcześniejsze ograniczenia w odpowiedziach modeli językowych, jak choćby świadome unikanie przez Google pytania o wybory w USA w 2024 roku czy krytyka za generowanie historycznie niepoprawnych obrazów.