
Nowe karty GeForce i Radeon to lepsza wydajność? Niektórzy mogą się zdziwić
Czy nowe karty graficzne rzeczywiście oferują wyższą wydajność? Serwis ComputerBase porównał osiągi starszych i nowszych modeli kart graficznych AMD Radeon oraz NVIDIA GeForce.
Nowe karty graficzne trafiły już do sprzedaży, a ceny w sklepach zaczynają spadać, co może zachęcać potencjalnych klientów do zakupu sprzętu nowej generacji. Ale czy rzeczywiście warto się na niego zdecydować?
Redakcja ComputerBase przygotowała ciekawe zestawienie, w którym porównała starsze i najnowsze modele kart graficznych AMD Radeon RX 7000 (RDNA 3) i Radeon RX 9000 (RDNA 4) oraz NVIDIA GeForce RTX 4000 (Ada Lovelace) i GeForce RTX 5000 (Blackwell), aby sprawdzić, czy nowe serie faktycznie oferują zauważalny wzrost wydajności. Wybrano karty o podobnej specyfikacji, co pozwoliło ze sobą w miarę miarodajnie porównać wydajność nowej i starej architektury. Szczegóły znajdziecie w tym artykule (po niemiecku).
Radeon RX 7000 vs Radeon RX 9000
Szczególnie warto zwrócić uwagę na porównanie kart Radeon – wybrano modele o zbliżonej specyfikacji, aby zestawić ze sobą architektury: Radeon RX 7600 XT (2048 jednostek na bazie architektury RDNA 3, 16 GB pamięci GDDR6, magistrala 128-bit) oraz Radeon RX 9060 XT (2048 jednostek na bazie architektury RDNA 4, 16 GB pamięci GDDR6, magistrala 128-bit).
Rasteryzacja
Nowa architektura RDNA 4 oferuje średnio o 20% wyższą wydajność przy tej samej teoretycznej mocy obliczeniowej w porównaniu do RDNA 3. To największy skok wydajności AMD od czasów przejścia z GCN na RDNA.
RDNA 4 przynosi zauważalny wzrost wydajności w rasteryzacji, choć przyrosty są nierównomierne i zależne od gry.
Ray tracing
Warto zauważyć, że nowa architektura przynosi znaczący przyrost wydajności w ray tracingu. Średni wzrost względem RDNA 3 to 31%, czyli o 11 punktów procentowych więcej niż w trybie zwykłej rasteryzacji.
W ray tracingu karty na bazie architektury RDNA 4 radzą sobie znacznie lepiej niż RDNA 3, co pozwala im się zbliżyć do modeli konkurencji, choć różnice nadal zależą od konkretnego tytułu.
Path tracing
Choć architektura RDNA 4 nie została zaprojektowana z myślą o pełnym path tracingu, zastosowane ulepszenia w jednostkach RT dają tu ogromne przyrosty wydajności – średnio aż 83% więcej FPS niż RDNA 3 w testowanych grach.
Redaktorzy zwracają uwagę, że w path tracingu RDNA 4 praktycznie podwaja wydajność względem poprzednika, co jest bardzo imponujące jak na architekturę nieoptymalizowaną stricte pod ten tryb renderowania.
GeForce RTX 4000 vs GeForce RTX 5000
Redakcja porównała także karty graficzne GeForce – w tym przypadku wybrano modele GeForce RTX 4070 Ti SUPER (8448 jednostek CUDA, architektura Ada Lovelace, 16 GB pamięci GDDR6X, magistrala 256-bit) oraz GeForce RTX 5070 Ti (8960 jednostek CUDA, architektura Blackwell, 16 GB pamięci GDDR7, magistrala 256-bit).
Rasteryzacja
NVIDIA promuje architekturę Blackwell m.in. poprzez zwiększoną wydajność obliczeń całkowitoliczbowych (integer performance), jednak nie przekłada się to na zauważalne korzyści w grach.
Średnio jest tylko 1% szybsza od architektury Lovelace (RTX 4000), co może wynikać z wyższej przepustowości pamięci, a nie z architektury samej w sobie. W grach korzystających z rasteryzacji, Blackwell oferuje marginalny wzrost wydajności, mieszczący się w granicach błędu pomiarowego.
Ray tracing
Mimo że NVIDIA deklaruje szybsze jednostki RT w Blackwellu, w praktyce nie przynoszą one korzyści. Blackwell średnio jest o 1% wolniejszy niż Ada Lovelace w grach z włączonym ray tracingiem. Wydajność w większości gier jest praktycznie identyczna, a różnice zależą od konkretnej gry.
Oznacza to, że architektura Blackwell nie przynosi realnej poprawy w ray tracingu, a czasem nawet wypada gorzej niż poprzednia generacja.
Path tracing
W przypadku renderowania pełnym śledzeniem promieni (path tracing), różnice są również znikome. Blackwell jest średnio o 1% szybszy od Lovelace w testowanych trzech grach.
Wniosek jest prosty - Path tracing nie przynosi przewagi architekturze Blackwell, mimo marketingowych deklaracji poprawionych jednostek RT.
Podsumowanie i wnioski
Redakcja zwraca uwagę, że trudno było przeprowadzić dokładne porównanie nowych generacji kart graficznych. Mimo to nie ma wątpliwości co do jednoznaczności i wartości uzyskanych wyników:
NVIDIA Blackwell nie oferuje wzrostu wydajności względem Lovelace – ani w rasteryzacji, ani w ray tracingu, ani w path tracingu. Owszem, w niektórych tytułach Blackwell wypada lepiej, ale są też gry, w których Lovelace ma przewagę. W ogólnym ujęciu nowa architektura NVIDII nie zapewnia realnego skoku wydajności.
Seria GeForce RTX 5000 zyskuje swoją przewagę nad RTX 4000 głównie dzięki: większej liczbie jednostek wykonawczych, wyższym taktowaniom, większemu poborowi mocy oraz nowym funkcjom – a nie dzięki samej architekturze.
Z kolei AMD RDNA 4 wypada zupełnie inaczej: w porównaniu z RDNA 3 jest to największy skok wydajności od czasów przejścia z GCN na RDNA.
- +20% FPS w grach rasteryzowanych
- +31% w ray tracingu
- +83% w path tracingu
Wzrosty wynikają zarówno z ulepszeń architektury, jak i wyższych taktowań. Dla kart pokroju RX 9070 XT vs RX 7800 XT około połowa wzrostu FPS pochodzi z nowej architektury, reszta z wyższego zegara. W ray tracingu większy wpływ ma właśnie nowa architektura.
Wzrost wydajności kart można rozumieć inaczej
Do tematu odniósł się Ryan Smith z serwisu AnandTech. Zauważył on, że wzrost wydajności kart graficznych nie powinien być automatycznie interpretowany jako wzrost IPC (instrukcji na cykl zegara). W przypadku kart graficznych, gdzie przetwarzanie jest wysoce równoległe, nawet przy tej samej częstotliwości zegara rzeczywista wydajność zależy głównie od liczby jednostek obliczeniowych (CU w AMD lub SM w NVIDII) — czyli fizycznych zasobów sprzętowych, a nie efektywności pojedynczej jednostki.
IPC w GPU to pojęcie bardzo nieprecyzyjne, bo w praktyce nie istnieje odpowiednik "jednowątkowego testu" znanego z CPU — nie da się łatwo przetestować pojedynczego CU czy SM w odizolowany sposób.
Dlatego wzrost liczby FPS w grach nie zawsze oznacza lepszą architekturę GPU. Często jest to po prostu efekt zwiększenia liczby jednostek obliczeniowych, a nie poprawy ich efektywności. Przy ocenie nowych generacji kart graficznych należy więc ostrożnie podchodzić do pojęcia „zysku IPC” – bo w świecie GPU jego rzeczywiste zmierzenie jest prawie niemożliwe.
Komentarze
1