Nowy GeForce 'Siedem'

Zgodnie z wcześniejszymi zapowiedziami, nVidia oficjalnie zaprezentowała dziś swoją najnowszą kartę graficzną Geforce 7800 GTX. Nowy chip graficzny jest wykonany w technologii 110 nanometrów i składa się z 300 milionów tranzystorów. Oznacza to, że jest to największy GPU jaki kiedykolwiek wyprodukowano na potrzeby grafiki. Zapraszamy do obszerniejszej prezentacji.

GeForce siedem...

Zgodnie z wcześniejszymi zapowiedziami, 22 czerwca nVidia oficjalnie zaprezentowała swoją najnowszą kartę graficzną Geforce 7800 GTX. Nowy chip graficzny jest wykonany w technologii 110 nanometrów i składa się z 300 milionów tranzystorów - NV40 w GeForce 6800 ma 220 milionów tranzystorów, a dla porównania taki dwurdzeniowy Pentium D 820 Intela 'jedynie' 230 mln. Oznacza to, że jest to największy GPU jaki kiedykolwiek wyprodukowano na potrzeby grafiki.

Image

Rdzeń premierowej karty 7800 GTX taktowany jest częstotliwością 430 MHz, a 256MB pamięci GDRR3-256bit @ 600 MHz (efektywne 1200 MHz).

Nowy GPU nVidii ma 8 jednostek Vertex Shader i 24 potoki pixeli. Prawdopodobnie chip jest niczym więcej jak NV40 z większą liczbą potoków i dwoma dodatkowymi Vertex Shaderami.

Wydajność wypełniania tego potwora (przy 24 potokach i zegarze 430) to ~10.3 miliardów pikseli/sekundę. Maksymalny pobór prądu oscyluje pomiędzy 100~110W. Karty mają być dostępne także w wersjach Geforce 7800 Ultra, oraz łączone w SLI.

 
ATi R480
nVidia NV40
nVidia G70
modele kart
X850 XT
6800 GT
6800 Ultra
7800 GTX
7800 Ultra
ilość tranzystorów
160 mln
222 mln
302 mln
technologia wykonania
130nm
130nm
110nm
Silnik graficzny
Smartshader HD
Pixel 2.0
Vertex 2.0
CineFX 3.0
Pixel 3.0
Vertex 3.0
CineFX 4.0
Pixel 3.0
Vertex 3.0
procesory vertexów
6
6
8
wydajność geometryczna
66 Gflops
54 Gflops
165 Gflps
liczba potoków
16x1
16x1
24x1
szyna do pamięci
256-bitowa DDR3
256-bitowa DDR3
256-bitowa DDR3
technologie
SmoothVision HD
Hyper Z HD
3Dc
NVIDIA HPDR
LMA III
Intellisample 3.0
UltraShadow II
NVIDIA HPDR
LMA III
Intellisample 4.0
UltraShadow II
możliwość łączenia
dwóch kart
nie
TAK
TAK

GeForce 6 była na tyle udaną serią (jeśli nie liczyć początkowych problemów ze zintegrowanym videoprocesorem), że nVidia tak na dobrą sprawę niewiele miała do poprawiania w nowym GPU. Jedynym problemem był zbyt duży pobór mocy i wydzielanie ciepła w najmocniejszych kartach GeForce 6800 Ultra. Wyprodukowanie chipa w technologii 110 nanometrów pozwoliło nVidii stworzyć super wydajną serię przy zachowaniu rozsądnego poboru prądu i temperaturze, która nie wymaga bardzo wydajnego i głośnego chłodzenia.

Trudno oprzeć się wnioskom, że nVidia już po raz drugi z rzędu wyprzedziła swojego konkurenta, firmę ATi, w wyścigu technologicznym. W kwietniu zeszłego roku prezentując nowoczesny GPU NV40 w pełni zgodny z DirectX 9c, a dziś po raz kolejny, wypuszczając jeszcze wydajniejszą wersje świetnego już procesora graficznego.

Luna - nowa' maskotka' serii GeForce7 ma wyraźnie azjatyckie rysy ;)

Image

Specyfikacja G70

Zasadniczy 'kruczek' w nowej specyfikacji G70 to rozróżnienie pomiędzy 'potokami pixeli' a 'potokami renderującymi piksele'. Tych pierwszych GPU ma aż 24, natomiast rzeczywistych potoków renderujących" jest 16, czyli tyle samo co w serii GeForce 6800. Jakie będzie to miało odzwierciedlenie w wydajności, przekonamy się wkrótce na wynikach benchmarków.

Architektura GPU GeForce 7:

8 jednostek Vertex Shader

24 potoki Pixel Shader

16 potoków ROP renderujących piksele

Image

Szczegółowa specyfikacja GPU:

  • 302 miliony tranzystorów, technologia wykonania 0.11 microna
  • 24-potokowa, superskalarna architektura z 8 jednostkami vertex
Image
  • silnik graficzny CineFX 4.0:
    * 128-bitowa zmiennoprzecinkowa prezycja kolorów (rendering w 32-bitowej, 64-bitowej i 128-bitowej palecie koloru)
    * pełna obsługa DirectX 9.0c (rozszerzona obsługa Pixel Shaderów)
    * pełna obsługa OpenGL 2.0

    programowalny Vertex Shader 3.0
    * Displacement Mapping, Geometry instancing, Vertex texture fetch (do 4 tekstur)
    * nieskończona długość programów vertexowych

Szczegółowa charakterystyka jednego potoku Vertex Shader

Image
  • programowalny Pixel Shader 3.0
    * 24 potoki Pixel Shader, 16 potoków renderujących piksele
    * dwie jednostki cieniujące na potok
    * 4 operacje FP na jedną jednostkę cieniującą, czyli łącznie 8 operacji na pixelu w jednym potoku.
    (dla porównania w geForce 6 tylko pierwsza jednostka cieniująca może wykonywać dwa typy instrukcji - operacje arytmetyczne i operacje odczytu tekstur - druga już tylko jeden typ instrukcji - operacje arytmetyczne).
    * 192 operacje PixelShader w jednym cyklu zegara,
    * nieskończona długość programów pixelowych
    * 16 i 32 bitowa zmiennoprzecinkowa precyzja
    * obsługa tekstur w formacie sRGB
    * obsługa kompresji tekstur DirectX i S3TC

Szczegółowa charakterystyka jednego potoku Pixel Shader (kliknij aby powiększyć)

- Szczegółowa charakterystyka jednego potoku ROP renderującego pixele

Image

Intellisample 3.0

- 2, 4, 8 i 16-krotne pełnoekranowe wygładzanie krawędzi (FSAA) metodą 'obracanej siatki'

- 2, 4, 8, i 16-krotne filtrowanie anizotropowe

- algorytmy kompresji HCT (High-resolution compression),

- bezstratne algorytmy kompresji koloru, tekstur i bufora Z, oraz szybkiego czyszczenia bufora Z,

- nowe techniki wygładzania krawędzi : Transparent Super-sampling" i "Transparent Multi-sampling"

- obsługa kompresji "map normalnych" - zgodność z techniką kompresji 3Dc

UltraShadow II

- algorytmy wspomagania obliczeń związanych z wyświetlaniem cieni - lepsza wydajność w grach wykorzystujących cienie w czasie rzeczywistym.

  • zintegrowany podwójny (10-bitowy) RAMDAC 400 MHz, umożliwiający wyświetlanie obrazu w rozdzielczości do 2048x1536 przy odwieżaniu 85Hz;
  • zintegrowany 165 MHzowy TMDS transmitter (DVI 1.0 / HDMI i HDCP)
  • zintegrowany videoprocesor
    * do sprzętowego dekodowania MPEG,
    * sprzętowa akceleracja WMV9,
    * skalowanie i filtrowanie sygnału video - NTSC/PAL do rozdzielczości 1024x768,
    * dekoder DVD/HDTV > MPEG2 do rozdzielczości 1920x1080i;
    - * sprzętowa komepnsacja ruchu (Motion Compensation), iDCT, DCT i konwersja koloru
  • NVIDIA Digital Vibrance Control 3.0 (DVC)

GeForce 7800 GTX

Do naszej redakcji na testy trafił inżynieryjny model karty wyprodukowany przez nVidię. GPU taktowany częstotliwością 430 MHz i 256MB pamięci GDDR3 @ 600 MHz.

Image

Tak jak modele z serii GeForce6, również i ta karta wyposażona jest w złącze SLI, umożliwiające spięcie dwóch urządzeń na płycie wyposażonej w dwa gniazda PCIE-Express x16. Wydajność takiego zestawu jest porażająca - 2 x 24 potoki, czyli ponad ~20 miliardów pikseli/sekundę.

W serii GeForce 7 zastosowano też funkcje dwustopniowego taktowania GPU - to cecha która zawsze podobała nam się w kartach nVidii, począwszy od GeForce FX. W trybie 2D karta pracuje z obniżonym zegarem @ 275 MHz, wydziela dzięki temu mniej ciepła, a cooler pracuje bardzo cicho na najniższych obrotach. Po uruchomieniu aplikacji 3D częstotliwość zostaje automatycznie zwiększona do 430MHz.

Image

G70 wyposażony jest w diodę termiczną zapobiegającą jego przegrzaniu. Gdy temperatura procesora przekroczy wartość krytyczną - 115°C - na ekranie monitora pojawi się stosowny komunikat, a częstotliwość taktowania GPU zostanie obniżona do czasu, aż jego temperatura spadnie.

Image

Podczas testów nie mieliśmy żadnych problemów z przegrzewaniem się karty. Podczas uruchomionych benchmarków kilka razy sprawdzaliśmy temperaturę termometrem na podczerwień - ani razu nie było odczytów przekraczających 60°C. Fabryczny cooler można uznać za cichy, aczkolwiek póki co o niczym to nie świadczy. Docelowo chcielibyśmy przetestować produkty które pojawią się na półkach sklepowych.

Jeśli chodzi o zasilanie kart, w dokumentacji nVidii wyczytaliśmy, że pojedynczej karty 7800 GTX wystarczy zasilacz o mocy 350W z 22 amperami przy napięciu 12V.

Do konfiguracji DUAL SLI GeForce 7800 GTX potrzebny nam będzie zasilacz o mocy 500W i 30 amperach na napięciu 12V.

Pierwsze testy wydajności

Jako że kartę mamy zaledwie od kilkunastu godzin, przed dalszym omówieniem nowych technologii - m.in. najbardziej interesujące naszym zdaniem "przeźroczyste wygładzanie krawędzi" - podzielimy się wynikami wydajności G70.

W 3D Marku 2005, wykorzystującym kod Vertex i Pixel Shader 3.0, nowa karta uzyskuje do 38% lepsze wyniki niż GeForce 6800 Ultra. Trzeba przyznać że to imponujący rezultat.

Image

Starszy już 3D Mark 2003 korzysta jedynie z kodu VS i PS 2.0, więc wzrost wydajności 'siódemki' w stosunku do 6800 Ultra płynie przede wszystkim z większej liczby jednostek Vertex Shader (8) i potoków Pixel Shader (24). Wydajność jest tu wyższa już tylko o około 25%.

Image
Image

W Doom3 osiągi 7800GTX są o około 30% lepsze od 6800 Ultra.

Image

I na zakończenie najlepszy powód, dla którego warto będzie kupić 7800 GTX. Battlefield 2 z włączonym maksymalnym filtrowaniem anizotropowym x16 i wygładzaniem krawędzi FSAA x4.

Image

Porównanie na szczycie

A teraz czas na spotkanie trzech najmocniejszych obecnie kart graficznych - nie licząc kombinacji SLI - w najbardziej reprezentatywnym benchmarku dla kart z nowoczesnym silnikiem graficznym - 3D Marku 2005.

Porównując liczbę FPS w sekwencjach GameTest, nowy GeForce 7800 GTX jest o około 25% szybszy od swoich poprzedników.

Na pierwszy plan wysuwa się niezwykła wydajność PixelShadera - o 70% wyższa od 6800 Ultra i ponad 90% od Radeona X850XT. Nic jednak dziwnego, 24 potoki PS robią swoje, a dodatkowo rdzeń Radeona technologicznie pozostaje trochę w tyle.

Dla odmiany zaskakuje nas stosunkowo niska wydajność 8 jednostek Vertex Shadera. Radeon X850XT mimo 6 jednostek uzyskuje tu nieco lepsze wyniki.

Wynik 10,000 MTexeli/s w testach MultiTeksturingu potwierdza ogromną moc wypełniania nowego G70 - 24 potoki x 430 MHz = 10.3 miliardów pikseli/sekundę

Image

Kolejny masywny test, przy włączonym wygładzaniu krawędzi AA x4 i maksymalnym filtrowaniu anizotropowym x16. Tu jak widać różnica pomiędzy 6800 Ultra spada już do około 15%. Możemy tylko domyślać się, że ma to coś wspólnego z liczbą potoków renderujących, których w G70 jest przecież tyle samo co w NV40.

Image

Skalowanie z mocą CPU

Sprawdziliśmy też jak G70 skaluje się z mocą CPU. Wbrew obiegowym opiniom i plotkom, dla nowego GeForce'a 7800 szybkość procesora jak widać nie ma wielkiego wpływu.

Image

Przeźroczyste wygładzanie AA

Jedną z nowych funkcji G70, która szczególnie zwróciła naszą uwagę jest "Przeźroczyste wygładzanie krawędzi AA". Tak do końca naprawdę nie wiadomo, czy jest to technologia dostępna tylko dla GeForce7 - realizowana sprzętowo - czy tylko nowa technika/algorytmy filtrowania tekstur, które można by również wykorzystać w GeForce 6. Niemniej jednak jej działanie jest wyśmienite ... no może z małymi wyjątkami, bo wszystko wskazuje, że cierpi ona jeszcze na chorobę wieku dziecięcego.

Image

W zaawansowanych ustawieniach sterownika możemy wybrać dwa typy tej techniki: próbkowanie wielokrotne i próbkowanie super. Efekty działania 'wielokrotnego' są raczej niezauważalne. Próbkowanie super daje rewelacyjne efekty ... pod warunkiem, że nVidia dopracuje tę technikę.

Kto grał chociażby w HalfLife2, zapewne doskonale pamięta ogrodzenia z drucianej siatki i całą masę przeróżnych różnych rusztowań, na które niestety nie działało wygładzanie krawędzi AA. Efekt był mniej więcej taki:

Włączone wygładzanie AAx4 i Anizo x16

słupki, druty itp (czyli wektory) są ładnie wygładzone, ale siatka, która jest przeźroczystą teksturą wygląda koszmarnie. - (kliknij aby podejrzeć pełny ekran)

Image

Różnicy w jakości obrazu przy włączonym 'próbkowaniu wielokrotnym' nie było żadnej. Obraz wyglądał dokładnie tak samo jak powyżej. Efekty dało dopiero włączenie 'próbkowania super'. Naszym zdaniem jest to strzał w dziesiątkę !

Włączone wygładzanie AAx4 i Anizo x16 + przeźroczyste próbkowanie super - (kliknij aby podejrzeć pełny ekran)

Image

Strata wydajności po włączeniu tej techniki jest nieznaczna, rzędu 5-10%. Przy ponad 60 fps, które uzyskaliśmy na GeForce7800 GTX w HL2 w rozdzielczości 1600x1200, z włączonym AAx4 i Anizo x16, utrata 5% praktycznie nie miała dla nas znaczenia.

Niestety, jak zaznaczyliśmy na początku korzystając z przeźroczystego'próbkowania super' można natknąć się na wiele błędów w grafice. Oto przykładowe:

Wszystkie przeźroczyste tekstury barierek i kratownic zostały pozbawione 'koloru'

- i tu również nie trudno się domyślić, które elementy/tekstury zostały 'zepsute' przez 'próbkowanie super'

Image
Wybrane dla Ciebie
ZANIM WYJDZIESZ... NIE PRZEGAP TEGO, CO CZYTAJĄ INNI!