
Google pokazał nową wersję Gemini. Przejmie kontrolę nad twoim urządzeniem
Google wprowadza Gemini 2.5 Computer Use. To nowy model sztucznej inteligencji stworzony do interakcji z interfejsami komputerowymi, które są zwykle przeznaczone dla ludzi.
Zadaniem Gemini 2.5 Computer Use jest automatyczne nawigowanie po graficznych interfejsach, takich jak strony internetowe, formularze czy mobilne aplikacje. Został wytrenowany pod kątem przewijania, klikania i wpisywania tekstu, przy jednoczesnym zrozumieniu zawartości ekranu.
Google przekonuje, że Gemini 2.5 Computer Use na tle konkurencji wyróżnia się wysoką wydajnością przy jednoczesnym utrzymaniu niskiego opóźnienia. Testy przeprowadzone przez partnerów miały pokazać, że nowy model wykonuje niektóre operacje nawet o 50 proc. szybciej niż alternatywne narzędzia.
Cytowani przez twórców pracownicy Google’a chwalą również zdolność modelu do niezawodnego analizowania kontekstu w skomplikowanych przypadkach. W sytuacjach, gdy konwencjonalne skrypty zawodzą, Gemini 2.5 Computer Use ma być w stanie skutecznie ocenić aktualny stan ekranu i autonomicznie określić niezbędne działania do ukończenia zadania.
Gemini 2.5 Computer Use zasili agentów AI
Gemini 2.5 Computer Use został udostępniony programistom, którzy mogą już integrować nowy model ze swoimi aplikacjami. Sam Google eksperymentuje z przeglądarkowym agentem Project Mariner, który obsługuje strony internetowe w imieniu użytkownika i docelowo ma zostać zintegrowany z Chrome’em. Póki co funkcja dostępna jest jedynie w wersji testowej dla użytkowników planu Google AI Ultra w USA.
Agenci AI znaleźli się jednak ostatnio na celowniku twórców konkurencyjnych przeglądarek, bo aplikacje Perplexity Comet czy Opera Neon już teraz potrafią same wykonywać złożone operacje na stronach internetowych. Gemini 2.5 Computer Use ma szansę usprawnić ich działanie, o ile twórcy zdecydują się na jego implementacje.
Komentarze
0Nie dodano jeszcze komentarzy. Bądź pierwszy!