GeForce siedem...
Zgodnie z wcześniejszymi zapowiedziami, 22 czerwca nVidia oficjalnie zaprezentowała swoją najnowszą kartę graficzną Geforce 7800 GTX. Nowy chip graficzny jest wykonany w technologii 110 nanometrów i składa się z 300 milionów tranzystorów - NV40 w GeForce 6800 ma 220 milionów tranzystorów, a dla porównania taki dwurdzeniowy Pentium D 820 Intela 'jedynie' 230 mln. Oznacza to, że jest to największy GPU jaki kiedykolwiek wyprodukowano na potrzeby grafiki.
Rdzeń premierowej karty 7800 GTX taktowany jest częstotliwością 430 MHz, a 256MB pamięci GDRR3-256bit @ 600 MHz (efektywne 1200 MHz).
Nowy GPU nVidii ma 8 jednostek Vertex Shader i 24 potoki pixeli. Prawdopodobnie chip jest niczym więcej jak NV40 z większą liczbą potoków i dwoma dodatkowymi Vertex Shaderami.
Wydajność wypełniania tego potwora (przy 24 potokach i zegarze 430) to ~10.3 miliardów pikseli/sekundę. Maksymalny pobór prądu oscyluje pomiędzy 100~110W. Karty mają być dostępne także w wersjach Geforce 7800 Ultra, oraz łączone w SLI.
| ATi R480 | nVidia NV40 | nVidia G70 | |
| modele kart | X850 XT | 6800 GT 6800 Ultra | 7800 GTX 7800 Ultra |
| ilość tranzystorów | 160 mln | 222 mln | 302 mln |
| technologia wykonania | 130nm | 130nm | 110nm |
| Silnik graficzny | Smartshader HD Pixel 2.0 Vertex 2.0 | CineFX 3.0 Pixel 3.0 Vertex 3.0 | CineFX 4.0 Pixel 3.0 Vertex 3.0 |
| procesory vertexów | 6 | 6 | 8 |
| wydajność geometryczna | 66 Gflops | 54 Gflops | 165 Gflps |
| liczba potoków | 16x1 | 16x1 | 24x1 |
| szyna do pamięci | 256-bitowa DDR3 | 256-bitowa DDR3 | 256-bitowa DDR3 |
| technologie | SmoothVision HD Hyper Z HD 3Dc | NVIDIA HPDR LMA III Intellisample 3.0 UltraShadow II | NVIDIA HPDR LMA III Intellisample 4.0 UltraShadow II |
| możliwość łączenia dwóch kart | nie | TAK | TAK |
GeForce 6 była na tyle udaną serią (jeśli nie liczyć początkowych problemów ze zintegrowanym videoprocesorem), że nVidia tak na dobrą sprawę niewiele miała do poprawiania w nowym GPU. Jedynym problemem był zbyt duży pobór mocy i wydzielanie ciepła w najmocniejszych kartach GeForce 6800 Ultra. Wyprodukowanie chipa w technologii 110 nanometrów pozwoliło nVidii stworzyć super wydajną serię przy zachowaniu rozsądnego poboru prądu i temperaturze, która nie wymaga bardzo wydajnego i głośnego chłodzenia.
Trudno oprzeć się wnioskom, że nVidia już po raz drugi z rzędu wyprzedziła swojego konkurenta, firmę ATi, w wyścigu technologicznym. W kwietniu zeszłego roku prezentując nowoczesny GPU NV40 w pełni zgodny z DirectX 9c, a dziś po raz kolejny, wypuszczając jeszcze wydajniejszą wersje świetnego już procesora graficznego.
Luna - nowa' maskotka' serii GeForce7 ma wyraźnie azjatyckie rysy ;)
Specyfikacja G70
Zasadniczy 'kruczek' w nowej specyfikacji G70 to rozróżnienie pomiędzy 'potokami pixeli' a 'potokami renderującymi piksele'. Tych pierwszych GPU ma aż 24, natomiast rzeczywistych potoków renderujących" jest 16, czyli tyle samo co w serii GeForce 6800. Jakie będzie to miało odzwierciedlenie w wydajności, przekonamy się wkrótce na wynikach benchmarków.
Architektura GPU GeForce 7:
8 jednostek Vertex Shader
24 potoki Pixel Shader
16 potoków ROP renderujących piksele
Szczegółowa specyfikacja GPU:
- 302 miliony tranzystorów, technologia wykonania 0.11 microna
- 24-potokowa, superskalarna architektura z 8 jednostkami vertex
- silnik graficzny CineFX 4.0:
* 128-bitowa zmiennoprzecinkowa prezycja kolorów (rendering w 32-bitowej, 64-bitowej i 128-bitowej palecie koloru)
* pełna obsługa DirectX 9.0c (rozszerzona obsługa Pixel Shaderów)
* pełna obsługa OpenGL 2.0
programowalny Vertex Shader 3.0
* Displacement Mapping, Geometry instancing, Vertex texture fetch (do 4 tekstur)
* nieskończona długość programów vertexowych
Szczegółowa charakterystyka jednego potoku Vertex Shader
- programowalny Pixel Shader 3.0
* 24 potoki Pixel Shader, 16 potoków renderujących piksele
* dwie jednostki cieniujące na potok
* 4 operacje FP na jedną jednostkę cieniującą, czyli łącznie 8 operacji na pixelu w jednym potoku.
(dla porównania w geForce 6 tylko pierwsza jednostka cieniująca może wykonywać dwa typy instrukcji - operacje arytmetyczne i operacje odczytu tekstur - druga już tylko jeden typ instrukcji - operacje arytmetyczne).
* 192 operacje PixelShader w jednym cyklu zegara,
* nieskończona długość programów pixelowych
* 16 i 32 bitowa zmiennoprzecinkowa precyzja
* obsługa tekstur w formacie sRGB
* obsługa kompresji tekstur DirectX i S3TC
Szczegółowa charakterystyka jednego potoku Pixel Shader (kliknij aby powiększyć)
- Szczegółowa charakterystyka jednego potoku ROP renderującego pixele
Intellisample 3.0
- 2, 4, 8 i 16-krotne pełnoekranowe wygładzanie krawędzi (FSAA) metodą 'obracanej siatki'
- 2, 4, 8, i 16-krotne filtrowanie anizotropowe
- algorytmy kompresji HCT (High-resolution compression),
- bezstratne algorytmy kompresji koloru, tekstur i bufora Z, oraz szybkiego czyszczenia bufora Z,
- nowe techniki wygładzania krawędzi : Transparent Super-sampling" i "Transparent Multi-sampling"
- obsługa kompresji "map normalnych" - zgodność z techniką kompresji 3Dc
UltraShadow II
- algorytmy wspomagania obliczeń związanych z wyświetlaniem cieni - lepsza wydajność w grach wykorzystujących cienie w czasie rzeczywistym.
- zintegrowany podwójny (10-bitowy) RAMDAC 400 MHz, umożliwiający wyświetlanie obrazu w rozdzielczości do 2048x1536 przy odwieżaniu 85Hz;
- zintegrowany 165 MHzowy TMDS transmitter (DVI 1.0 / HDMI i HDCP)
- zintegrowany videoprocesor
* do sprzętowego dekodowania MPEG,
* sprzętowa akceleracja WMV9,
* skalowanie i filtrowanie sygnału video - NTSC/PAL do rozdzielczości 1024x768,
* dekoder DVD/HDTV > MPEG2 do rozdzielczości 1920x1080i;
- * sprzętowa komepnsacja ruchu (Motion Compensation), iDCT, DCT i konwersja koloru - NVIDIA Digital Vibrance Control 3.0 (DVC)
GeForce 7800 GTX
Do naszej redakcji na testy trafił inżynieryjny model karty wyprodukowany przez nVidię. GPU taktowany częstotliwością 430 MHz i 256MB pamięci GDDR3 @ 600 MHz.
Tak jak modele z serii GeForce6, również i ta karta wyposażona jest w złącze SLI, umożliwiające spięcie dwóch urządzeń na płycie wyposażonej w dwa gniazda PCIE-Express x16. Wydajność takiego zestawu jest porażająca - 2 x 24 potoki, czyli ponad ~20 miliardów pikseli/sekundę.
W serii GeForce 7 zastosowano też funkcje dwustopniowego taktowania GPU - to cecha która zawsze podobała nam się w kartach nVidii, począwszy od GeForce FX. W trybie 2D karta pracuje z obniżonym zegarem @ 275 MHz, wydziela dzięki temu mniej ciepła, a cooler pracuje bardzo cicho na najniższych obrotach. Po uruchomieniu aplikacji 3D częstotliwość zostaje automatycznie zwiększona do 430MHz.
G70 wyposażony jest w diodę termiczną zapobiegającą jego przegrzaniu. Gdy temperatura procesora przekroczy wartość krytyczną - 115°C - na ekranie monitora pojawi się stosowny komunikat, a częstotliwość taktowania GPU zostanie obniżona do czasu, aż jego temperatura spadnie.
Podczas testów nie mieliśmy żadnych problemów z przegrzewaniem się karty. Podczas uruchomionych benchmarków kilka razy sprawdzaliśmy temperaturę termometrem na podczerwień - ani razu nie było odczytów przekraczających 60°C. Fabryczny cooler można uznać za cichy, aczkolwiek póki co o niczym to nie świadczy. Docelowo chcielibyśmy przetestować produkty które pojawią się na półkach sklepowych.
Jeśli chodzi o zasilanie kart, w dokumentacji nVidii wyczytaliśmy, że pojedynczej karty 7800 GTX wystarczy zasilacz o mocy 350W z 22 amperami przy napięciu 12V.
Do konfiguracji DUAL SLI GeForce 7800 GTX potrzebny nam będzie zasilacz o mocy 500W i 30 amperach na napięciu 12V.
Pierwsze testy wydajności
Jako że kartę mamy zaledwie od kilkunastu godzin, przed dalszym omówieniem nowych technologii - m.in. najbardziej interesujące naszym zdaniem "przeźroczyste wygładzanie krawędzi" - podzielimy się wynikami wydajności G70.
W 3D Marku 2005, wykorzystującym kod Vertex i Pixel Shader 3.0, nowa karta uzyskuje do 38% lepsze wyniki niż GeForce 6800 Ultra. Trzeba przyznać że to imponujący rezultat.
Starszy już 3D Mark 2003 korzysta jedynie z kodu VS i PS 2.0, więc wzrost wydajności 'siódemki' w stosunku do 6800 Ultra płynie przede wszystkim z większej liczby jednostek Vertex Shader (8) i potoków Pixel Shader (24). Wydajność jest tu wyższa już tylko o około 25%.
W Doom3 osiągi 7800GTX są o około 30% lepsze od 6800 Ultra.
I na zakończenie najlepszy powód, dla którego warto będzie kupić 7800 GTX. Battlefield 2 z włączonym maksymalnym filtrowaniem anizotropowym x16 i wygładzaniem krawędzi FSAA x4.
Porównanie na szczycie
A teraz czas na spotkanie trzech najmocniejszych obecnie kart graficznych - nie licząc kombinacji SLI - w najbardziej reprezentatywnym benchmarku dla kart z nowoczesnym silnikiem graficznym - 3D Marku 2005.
Porównując liczbę FPS w sekwencjach GameTest, nowy GeForce 7800 GTX jest o około 25% szybszy od swoich poprzedników.
Na pierwszy plan wysuwa się niezwykła wydajność PixelShadera - o 70% wyższa od 6800 Ultra i ponad 90% od Radeona X850XT. Nic jednak dziwnego, 24 potoki PS robią swoje, a dodatkowo rdzeń Radeona technologicznie pozostaje trochę w tyle.
Dla odmiany zaskakuje nas stosunkowo niska wydajność 8 jednostek Vertex Shadera. Radeon X850XT mimo 6 jednostek uzyskuje tu nieco lepsze wyniki.
Wynik 10,000 MTexeli/s w testach MultiTeksturingu potwierdza ogromną moc wypełniania nowego G70 - 24 potoki x 430 MHz = 10.3 miliardów pikseli/sekundę
Kolejny masywny test, przy włączonym wygładzaniu krawędzi AA x4 i maksymalnym filtrowaniu anizotropowym x16. Tu jak widać różnica pomiędzy 6800 Ultra spada już do około 15%. Możemy tylko domyślać się, że ma to coś wspólnego z liczbą potoków renderujących, których w G70 jest przecież tyle samo co w NV40.
Skalowanie z mocą CPU
Sprawdziliśmy też jak G70 skaluje się z mocą CPU. Wbrew obiegowym opiniom i plotkom, dla nowego GeForce'a 7800 szybkość procesora jak widać nie ma wielkiego wpływu.
Przeźroczyste wygładzanie AA
Jedną z nowych funkcji G70, która szczególnie zwróciła naszą uwagę jest "Przeźroczyste wygładzanie krawędzi AA". Tak do końca naprawdę nie wiadomo, czy jest to technologia dostępna tylko dla GeForce7 - realizowana sprzętowo - czy tylko nowa technika/algorytmy filtrowania tekstur, które można by również wykorzystać w GeForce 6. Niemniej jednak jej działanie jest wyśmienite ... no może z małymi wyjątkami, bo wszystko wskazuje, że cierpi ona jeszcze na chorobę wieku dziecięcego.
W zaawansowanych ustawieniach sterownika możemy wybrać dwa typy tej techniki: próbkowanie wielokrotne i próbkowanie super. Efekty działania 'wielokrotnego' są raczej niezauważalne. Próbkowanie super daje rewelacyjne efekty ... pod warunkiem, że nVidia dopracuje tę technikę.
Kto grał chociażby w HalfLife2, zapewne doskonale pamięta ogrodzenia z drucianej siatki i całą masę przeróżnych różnych rusztowań, na które niestety nie działało wygładzanie krawędzi AA. Efekt był mniej więcej taki:
Włączone wygładzanie AAx4 i Anizo x16
słupki, druty itp (czyli wektory) są ładnie wygładzone, ale siatka, która jest przeźroczystą teksturą wygląda koszmarnie. - (kliknij aby podejrzeć pełny ekran)
Różnicy w jakości obrazu przy włączonym 'próbkowaniu wielokrotnym' nie było żadnej. Obraz wyglądał dokładnie tak samo jak powyżej. Efekty dało dopiero włączenie 'próbkowania super'. Naszym zdaniem jest to strzał w dziesiątkę !
Włączone wygładzanie AAx4 i Anizo x16 + przeźroczyste próbkowanie super - (kliknij aby podejrzeć pełny ekran)
Strata wydajności po włączeniu tej techniki jest nieznaczna, rzędu 5-10%. Przy ponad 60 fps, które uzyskaliśmy na GeForce7800 GTX w HL2 w rozdzielczości 1600x1200, z włączonym AAx4 i Anizo x16, utrata 5% praktycznie nie miała dla nas znaczenia.
Niestety, jak zaznaczyliśmy na początku korzystając z przeźroczystego'próbkowania super' można natknąć się na wiele błędów w grafice. Oto przykładowe:
Wszystkie przeźroczyste tekstury barierek i kratownic zostały pozbawione 'koloru'
- i tu również nie trudno się domyślić, które elementy/tekstury zostały 'zepsute' przez 'próbkowanie super'