Aplikacje mobilne

Google Gemini z nową funkcją. Nawet ChatGPT tego nie potrafi

przeczytasz w 2 min.

Sprawdziłem, jak Google Gemini radzi sobie z analizą wideo. Nowa funkcja na razie dostępna jest tylko w płatnym abonamencie, ale jest szansa, że wkrótce się to zmieni.

Google ogłosił, że jego chatbot zasilany jest teraz przez najnowsze modele językowe Gemini 2.5 Flash oraz Gemini 2.5 Pro, które dotychczas dostępne były w wersjach poglądowych. Na tym jednak nie koniec nowości. 

Do Gemini po cichu trafiła funkcja analizowania filmów, która działa zaskakująco dobrze. 

Google Gemini - tak działa analizowanie wideo

Gemini już wcześniej potrafił analizować zdjęcia, filmy z YouTube’a czy obraz z kamery w czasie rzeczywistym. Teraz doszła do tego możliwość wykonywania poleceń związanych z własnymi plikami wideo. 

W ramach testu załadowałem krótki fragment wystąpienia generała Mirosława Hermaszewskiego, w którym miałem okazję uczestniczyć kilka lat temu. Gemini - zgodnie z poleceniem - zidentyfikował mówcę i wzorowo streścił jego wypowiedź. 

Poleciłem również sztucznej inteligencji wypunktowanie funkcji omówionych na 9-minutowej prezentacji telefonu z 2021 roku w języku angielskim, ich krótkie opisanie i wskazanie przedziałów czasowych. Gemini wykonał to zadanie bezbłędnie w mniej niż pół minuty. 

AI Google’a poradziło sobie także ze streszczeniem fragmentu konferencji prasowej w języku chińskim. 

To, z czym Gemini za bardzo sobie nie radzi, to precyzyjna analiza ruchu. Gdy załadowałem wideo, na którym otwieram zamek PIN-owy i poprosiłem o wskazanie szyfru, sztuczna inteligencja poległa. Podejrzewam, że algorytm analizuje jedynie dźwięk i co którąś klatkę obrazu. 

Analiza wideo to jedna z najprzydatniejszych i unikatowych funkcji Gemini

Konkurencyjny ChatGPT w teorii co prawda także potrafi analizować pliki wideo, ale w praktyce ta analiza sprowadza się do wskazania formatu, rozdzielczości, klatkażu czy bitrate’u. Gemini ma na tym polu miażdżącą przewagę, bo faktycznie uwzględnia treść wideo razem z dźwiękiem. 

W chwili publikacji tego artykułu analiza wideo działa jedynie w płatnym planie Google AI Pro, wycenionym na 97,99 zł/mies. Niewykluczone jednak, że wkrótce się to zmieni, bo większość dotychczasowych funkcji zdążyła już trafić do planu darmowego, choć zazwyczaj następuje to z kilkutygodniowym opóźnieniem.

Komentarze

4
Zaloguj się, aby skomentować
avatar
Komentowanie dostępne jest tylko dla zarejestrowanych użytkowników serwisu.
  • avatar
    Kolcobrzuch
    1
    W końcu będzie można się czegoś dowiedzieć z YT zamiast ogladać 3 minutowy wstęp, minutową żerabraninę o like and subscribe, fragment od sponsora by na końcu znaleźć informację któej szukasz w 30 sekundowym fragmencie klipu.
    • avatar
      GejzerJara
      -1
      @Miron , ty się czegokolwiek potrafisz nauczyć? cytuję ciebie: "chatbot zasilany jest teraz przez najnowsze modele językowe"

      to ile prądu do zasilania mają te modele językowe, aby mogły dalej zasilać czatbota?

      jak tak czytam te twoje dziwne teksty, to odnoszę wrażenie że ten kaszkiecik zasila twoją głowę. i tu pytanie.... czy ten twój kaszkiecik zasila samochód spalinowy jeśli do niego wsiadasz?

      Witaj!

      Niedługo wyłaczymy stare logowanie.
      Logowanie będzie możliwe tylko przez 1Login.

      Połącz konto już teraz.

      Zaloguj przez 1Login