Grok 4 przewyższa poziom doktorancki. Elon Musk prezentuje przełomowy model AI

10 lipca 2025przeczytasz w 2 min.

xAI zaprezentowało Grok 4 – nowy model sztucznej inteligencji, który ma przewyższać konkurencję w wielu wymagających testach. Musk twierdzi, że Grok 4 radzi sobie lepiej niż doktorant w każdej dziedzinie wiedzy, choć „czasem brakuje mu zdrowego rozsądku”.

Grok, model sztucznej inteligencji stworzony przez firmę xAI Elona Muska, jest ściśle zintegrowany z platformą X (dawniej Twitter). Ostatnia aktualizacja Groka wywołała kontrowersje — model zaczął generować obraźliwe i wulgarne odpowiedzi oraz promować nietypowe i kontrowersyjne treści. Sytuacja ta rodzi pytania o kontrolę nad AI i intencje Muska. Firma przyznała się do problemu i zapewniła, że wprowadziła dodatkowe mechanizmy mające blokować mowę nienawiści przed jej publikacją na platformie X.

W międzyczasie xAI zaprezentowało nowy model — Grok 4, który według zapowiedzi ma znacznie przewyższać konkurencyjne rozwiązania, takie jak ChatGPT od OpenAI czy Gemini od Google. Szczegóły opisuje serwis Tech Crunch.

Grok 4 i Grok 4 Heavy

xAI właściwie wprowadziło na rynek dwa modele: Grok 4 oraz jego zaawansowaną wersję Grok 4 Heavy. Podstawowy Grok 4 to potężny model sztucznej inteligencji, który samodzielnie odpowiada na różnorodne pytania i zadania, osiągając wysokie wyniki w testach akademickich.

Z kolei Grok 4 Heavy to wersja „multi-agentowa”, która znacznie zwiększa możliwości modelu dzięki jednoczesnej pracy wielu agentów AI. Każdy z nich niezależnie analizuje problem, a następnie wspólnie porównują swoje odpowiedzi, podobnie jak zespół badawczy, aby wyłonić najlepsze rozwiązanie. Ta współpraca wielu agentów pozwala Grok 4 Heavy działać szybciej i skuteczniej, szczególnie przy bardziej skomplikowanych zadaniach i w zastosowaniach profesjonalnych.

"Jeśli chodzi o pytania akademickie, Grok 4 przewyższa poziom doktorancki we wszystkich dziedzinach, bez wyjątku” — powiedział Elon Musk podczas środowej transmisji na żywo. „Czasami może brakować mu zdrowego rozsądku i jeszcze nie wynalazł nowych technologii ani nie odkrył nowej fizyki, ale to tylko kwestia czasu.”

Testy Grok 4 – ma być lepszy niż konkurencja

Grok 4 bez wspomagających narzędzi uzyskał wynik 25,4% w teście Humanity’s Last Exam, pokonując modele takie jak Gemini 2.5 Pro (21,6%) i OpenAI o3 (21%). Z kolei Grok 4 Heavy, korzystając z dodatkowych narzędzi, osiągnął aż 44,4%, wyraźnie wyprzedzając konkurencję.

Model Grok uzyskał także najlepszy wynik w teście ARC-AGI-2, który sprawdza zdolność AI do rozpoznawania wzorców wizualnych – zdobywając 15,9%, czyli niemal dwa razy więcej niż Claude Opus 4.

Abonament SuperGrok Heavy

Wraz z premierą modeli, xAI wprowadziło najdroższy jak dotąd plan subskrypcyjny – SuperGrok Heavy, w cenie 300 dol. miesięcznie. Użytkownicy zyskują wcześniejszy dostęp do Grok 4 Heavy i nadchodzących funkcji, które xAI zamierza wprowadzić w najbliższych miesiącach. Według podanych informacji, w sierpniu pojawi się model AI do kodowania, we wrześniu agent multimodalny, a w październiku – model do generowania wideo.

Przeczytaj także:

Komentarze

Zaloguj się, aby skomentować

Warmonger
2025-07-1015:21
2
Prezentacje mają to do siebie, że rozmijają się z rzeczywistością.

Czekam na niezależne testy. Jak na razie nikt inny nie potwierdził tych rewelacji.
piomiq
2025-07-1022:26
1
Jakieś benchmarki były robione, czy to tylko "Musk tak twierdzi"?
Kolejna sensacyjka, którą bardzo chętnie prezentuje ten plotkarsko-techniczy portal (chyba bardziej plotkarski).
piomiq
2025-07-1022:30
0
"choć „czasem brakuje mu zdrowego rozsądku”
Duże modele językowe nie myślą, zatem nie mają zdrowego rozsądku. To tylko generator słów.
To co Musk gada to zwykła paplanina marketingowa. Wiele rzeczy twierdził co się miało nijak do rzeczywistości.

anemusek
2025-07-1019:51
-2
Elon wiele rzeczy w swoim życiu twierdził. Raczej żadna nie była prawdziwa. A sam Grok to jeden z gorszych modeli, ot zabaweczka.
kkastr
2025-07-1107:42
0
Moje (nieliczne) próby porównania darmowych wersji ChataGPT i Groka jak na razie wskazują, że Grok nieco mniej zmyśla przy pytaniach o konkretne, ale bardzo wąskie tematycznie detale. Różnica nie jest jednak na tyle duża by było to jakoś bardzo istotne, w obydwu przypadkach trzeba bardzo uważać i wszystko weryfikować.
Naruto1
2025-07-1112:12
0
"model zaczął generować obraźliwe i wulgarne odpowiedzi oraz promować nietypowe i kontrowersyjne treści."

Pewnie się narażę, ale... Wziął ktoś pod uwagę, że może "mieć rację" (chociaż częściowo) albo po prostu "mówi" to, co wielu ludzi myśli ale prawo tudzież poprawność polityczna nie pozwala powiedzieć głośno? Jeśli polityk mówi rano jedno, wieczorem drugie a na drugi dzień twierdzi, że w ogóle nic nie mówił, to jak go nazwiemy, choćby w myślach (np. z obawy przed wymiarem sprawiedliwości)?

Grok 4 i Grok 4 Heavy

Testy Grok 4 – ma być lepszy niż konkurencja

Abonament SuperGrok Heavy

Komentarze

Witaj!