Nowa generacja
Czas leci nieubłaganie, od pseudoakceleratorów 3D takich jak ViRGE, o którym można było powiedzieć najwyżej, że jest kompatybilny z tym czy innym standardem (na tej samej zasadzie, co Maluch jest kompatybilny z torem LeMans) układy graficzne przeszły długa drogę. Teraz są drogimi, skomplikowanymi procesorami specjalizowanymi o skali integracji trzykrotnie większej niż obecne procesory systemowe.
Od czasów ViRGE'a zmienił się również rynek - firma S3 zniknęła, Matrox jest legendą jedynie dla weteranów, Intel niepodzielnie rządzi rynkiem układów graficznych w ogóle, zaś rynek chipów 3D podzielony został mniej więcej równo między ATi i nvidię, które walcząc ze sobą zaciekle, mniej więcej co pół roku przekazują - albo raczej wyrywają sobie ;) - koronę lidera.
Ponownie nadeszła kolej na rządy nvidii, a sztucznie - przy pomocy GeForce'a 7950GX2 - osiągnięta przewaga nad Radeonem X1950XTX przypieczętowana została właśnie premierą układu nowej, ósmej już generacji: G80 - GeForce'a 8800. Na odpowiedź ATI - R600 - przyjdzie nam poczekać do początku przyszłego roku, spójrzmy więc na nowe możliwości, oferowane przez G80.
26.5 centymetrowy GeForce 8800 GTX
DirectX 10 i SM 4.0
Nowy GeForce jest pierwszym na świecie chipem wyposażonym w standard shaderów 4.0, a więc kompatybilny z DirectX 10. GeForce 8800 jest również pierwszym chipem o tak wysokim stopniu komplikacji - na jego konstrukcje przypada aż 681 milionów tranzystorów.
GeForce 8800 GTS - wydanie pudełkowe, karta ASUS
| karta | GeForce 7950 GX2 | GeForce 8800 GTS | GeForce 8800 GTX |
| chip | 2x G70 | G80 | G80 |
| technologia wykonania | 90nm | 90nm | 90nm |
| PCB | - | P356 (23cm) | P355 (26,5cm) |
| zgodność z DX i SM | DirectX 9c Shader Model 3.0 | DirectX 9c i 10 Shader Model 4.0 | DirectX 9c i 10 Shader Model 4.0 |
| potoki renderujące ROP | 2x 16 | 20 | 24 |
| teoretyczna wydajność | 24 Gtex/sec | 24 Gtex/sec | 36 Gtex/sec |
| Stream Procesors | 48* | 96 | 128 |
| ALU | 48* | 96 | 128 |
| rozdzielanie danych | n/a | Stream Output GigaThread | Stream Output GigaThread |
| zegar GPU | 500 MHz | 500 MHz | 575 MHz |
| zegar Shader | n/a | 1200 MHz | 1350 MHz |
| szyna do pamięci | 512-bit | 320-bit | 384-bit |
| ilość pamięci | 2 x 512MB | 640 MB | 768 MB |
| typ pamięci | GDDR3 | GDDR3 | GDDR3 |
| zegar pamięci | 600 MHz (1200) | 800 MHz (1600) | 900 MHz (1800) |
| przepustowość pamięci | ~75 GB/s | ~62 GB/s | ~85 GB/s |
| HDR i FSAA | Intellisample | Lumenex Engine | Lumenex Engine |
| obliczenia fizyki | n/a | Quantum Effects | Quantum Effects |
| jakość obrazu video | Pure Video | Pure Video | Pure Video |
Architektura G80 - zmiany, zmiany, zmiany...
G80 wprowadza kilka istotnych zmian w architekturze, w stosunku do G7x. Najciekawszą z nich jest architektura Unified Shader, zgodna ze standardem Shader Model 4.0 a tym samym z DirectX 10. W przypadku poprzednich wersji Shader Model, jednostki cieniowania stanowiły osobne części układu - mieliśmy Pixel Shadery zajmujące się kolorowaniem pikseli, Vertex Shadery, operujące na wierzchołkach wielokątów sceny 3D, w planach były także Geometry Shader, potrafiące już operować na całych obiektach, a także tworzyć je i niszczyć, zdejmując tę funkcję z barków CPU.
architektura G80:
8 Shaderów, w każdym 16 procesorów strumieni (SP) łącznie 128, taktowanych zegarem 1.35GHz
i 8 jednostek filtrowania tekstur (TF), razem 64.
Wszystko to działało wydajnie, póki obrabiana scena wymagała użycia różnych shaderów w takim stosunku jak obliczył twórca układu, ale wszystko brało w łeb, jeśli do obliczania sceny używany był przede wszystkim jeden typ jednostek cieniowania. Pozostałe czekały wtedy bezczynnie, a wydajność spadała. Nowa architektura rozwiązuje ten problem: 128 jednostek nazwanych procesorami strumieni (Stream Procesors), taktowanych wspólnie zegarem dwukrotnie wyższym niż reszta układu spełnia funkcje takich shaderów, jakie są w danej chwili potrzebne.
poglądowy przykład działania Unified Shader
c.d. architektura G80
Ponieważ Stream Processor nie może w tej samej chwili realizować jednocześnie funkcji Vertex, Pixel, Geometry czy Physics shaderów, układ wyposażony został w technologię Stream Output, która obrobione przez jeden typ shaderów dane wysyła do pamięci, a stamtąd znów do jednostki Stream Processor, ale na koniec kolejki, gdzie czekają na obróbkę przez następny typ shaderów. Za obsługę rozdzielania danych między shaderami odpowiada technologia GigaThread, która obsługuje tysiące wątków obliczeniowych na raz.
G80 wyposażony jest w 64 jednostki filtrowania tekstur, a więc może w jednym cyklu zegara obrobić 64 piksele. To o 40 pikseli więcej niż był w stanie obrobić G70. Śledząc dalej zagadnienia związane z ilością pikseli na jeden takt zegara można zauważyć, że dzięki 6 jednostkom ROP, z których każda może wyrenderować 4 piksele, GeForce 8800 GTX może w jednym takcie zegara wygenerować 24 pełne piksele, a to oznacza również, że marzenia o jednoczesnym, bezstresowym używaniu 128-bitowego HDR i FSAA 16x spełniły się.
Za te dwa ostatnie efekty odpowiada tzw. Lumenex Engine, który obsługuje następujące tryby FSAA: MSAA (multisampling), SSAA (supersampling) oraz TAA (tryb sprawdzający się przy wygładzaniu krawędzi na obiektach półprzezroczystych).
Pojedynczy GeForce 8800 obsługuje wszystkie tryby FSAA do 16xQ, na dodatek w nowych grach, wydajność tego najwyższego trybu nie powinna odbiegać od wydajności starego trybu 4x.
Dodatkowo w sterownikach pojawi się tryb FSAA nazwany Application Enhanced, który pozwoli na komunikowanie się gry ze sterownikami i automatyczne ustalanie, w których elementach sceny potrzebne jest wygładzanie krawędzi. Taki tryb był obecny w pradawnych układach Rendition Verite i w nieudanym powrocie Matroxa na rynek 3D, chipie Parhelia.
Tryb HDR jest w G80 zgodny ze standardem OpenEXR i liczony z 128-bitową dokładnością. W przypadku GeForce 8800, nvidia poszła po rozum do głowy i teraz Filtrowanie Anizotropowe wygląda tak samo ładnie jak w przypadku chipów ATI Radeon X1000.
Fizyka onboard?
Ostatnimi czasy, nową modą na rynku stały się, a raczej próbowały stać się, akceleratory fizyki - samodzielny układ PhysX firmy AGEIA oraz zapowiadany układ trzech Radeonów, który ATI na razie opóźniło. Nvidia jak dotąd ignorowała ów trend, ale w G80 pojawia się Quantum Effects, czyli warstwa układu odpowiedzialna właśnie za wspomaganie obliczeń fizycznych, a zwłaszcza takich efektów dym, ogień, woda, zachowanie sie odzieży na postaciach i tym podobne.
Czas pokaże czy ta funkcja zdobędzie jakąś popularność. Technologia Qunatum Effects jest oczywiście realizowana przez opisane już zunifikowane shadery do wszystkiego.
Karty GeForce 8800
Niestety, z racji skomplikowania, chip nadal produkowany jest w procesie 90nm, a więc charakteryzuje się tragicznie wielkim poborem prądu - ponad 140 W
pobór mocy w Watach
| karta | GeForce 8800 GTX | GeForce 8800 GTS |
| pobór prądu | 12V, 30A | 12V, 26A |
| wymagane wtyczki PEG | 2x 6 pin PEG | 1x 6 pin PEG |
| minimalny zasilacz | 450 W | 400 W |
GeForce 8800 GTX wymaga aż dwóch wtyczek zasilania PEG (od lewej: zasilanie GTS i GTX)
Mimo to, pracująca karta GeForce nie jest specjalnie głośna - to zasługa wielkiego układu chłodzenia, powodującego przy okazji, że karta zajmuje szerokość dwóch gniazd PCI.
Dla 8800 GTX potrzebne są duże i przestronne obudowy - ledwo mieści się w stadardowej ATX
Na kartach GeForce 8800 umieszczono drugi układ odpowiedzialny za I/O, czyli coś co było od niepamiętnych czasów zintegrowane. Krótko pisząc Nvidia przeniosła całe przetwarzanie potokowe do zewnętrznego komponentu.
Ciekawe jest to, że G80 jest już ogromny sam w sobie, mierzy około 480mm2, czyli niewiele więcej od R600. Gdy dodamy do tego konieczne 50mm2 na I/O chipu, daje to łącznie 530mm2, a to już dużo więcej od R600. Dla porównania G71 ma 197mm2 wraz z I/O, tak więc nowy układ urósł prawie trzykrotnie.
G80 jest OGROMNY! Po lewej dla porównania QuadCore Intela
Wygląda na to, że Nvida ma problemy z przesunięciem silnika wątków na zewnątrz i upakowaniem go w rozsądnym rozmiarze, podczas gdy ATI opracowuje już trzecią lub czwartą generację. Nasuwa to interesujący wniosek dotyczący zintegrowanego przetwarzania potokowego, w myśl którego pierwsze generacje były duże, a z każdą nową odsłoną stają się coraz mniejsze i szybsze.
drugi układ na karcie odpowiedzialny za I/O
Tak więc Nvidia wyciągnęła końcówki układu na zewnątrz. Niby żadne to wydarzenie. Mimo że układy 480mm2 plus 50mm2 są z pewnością tańsze niż chip o powierzchni 530mm2, tak naprawdę końcowy koszt jest większy ponieważ trzeba jeszcze wziąć pod uwagę, oprócz ceny produkcji drugiej części, koszt wyprodukowania płyty z dwoma zamiast jedno chipu. Dla pięknego i dzikiego świata zagadkowych komponentów, to żadne wydarzenie.
Maszyna testowa
Premierowe karty GeForce 8800 GTX oraz ASUS 8800 GTS, przetestowaliśmy na komputerze Geo-PC dostarczonym nam przez firmę Komputronik.
Specyfikacja zestawu:
• procesor: QuadCore Intel Core 2 Extreme QX6700, 2666 MHz (10 x 267)
• chłodzenie: Zalman CNPS 9500 LED;
radiator miedziany, wiatrak 2600 obr./min, 27,5 dB
• referencyjny GeForce 8800 GTX, oraz pudełkowa wersja ASUS GeForce 8800 GTS
• płyta główna: EVGA z chipsetem nvidia 680i
• pamięci RAM: 2GB DDR2 @800, 2x Corsair CM2X1024-8500C5D DHX Technology
fabrycznie to moduły 1066MHz z CL5-5-5-15, tu zostały ustawione jako 800MHz z CL4-4-4-15-T1
• karta muzyczna: Creative SB X-Fi Fatal1ty Sound Card
• dyski twarde: 2x WD740GD Stripe (Raptor 74GB) i 2x WD2500KS Mirror (SE-16 250GB)
• zasilacz: TAGAN 900W - U95 TurboJet Serie Dual Fan
Testy wydajności: 3Dmarki 05 i 06
Nowa seria GeForce 8800 jest potwornie szybka. Nieczęsto nam się zdarza wypowiadać to stwierdzenie, ale wyniki po prostu miażdżą karty poprzedniej generacji.
W pierwszym z testów - reprezentującym starsze gry DirectX 9 i Shader Model 2.0 - GeForce 8800 GTS jest o 46% szybszy od 7900 GTX, natomiast 8800GTX o 40% wyprzedza dwuprocesorowego 7950 GX2. Nawet z włączonym wygładzaniem krawędzi AAx4 i AAx8 karty radzą sobie znakomicie.
Różnica pomiędzy GTS a GTX wynosi w tym wypadku zaledwie ~20%.
W bardziej zaawansowanym 3DMarku06 i jego testach w kodzie Shader Model 3.0 z efektami HDR, różnica pomiędzy GTS i GTX miejscami wzrasta już nawet do 30%. Analogicznie jak powyżej, przewaga nad starszymi kartami 7900GTX i 7950GX2 wynosi nadal 50 i 40%. Tu nawet nie ma co komentować, jeśli wziąć pod uwagę osiągi tych kart z włączonym FSAA x8, jest to totalny pogrom. No i w końcu nvidia ma równoczesny antyaliasing z efektami HDR.
c.d. Testy wydajności: FEAR, HL2, SS2, Company of Heroes
Wspominaliśmy kiedyś, że FEAR jest grą strasznie łakomą na ilość pamięci i szerokość szyny danych. Tu widać to doskonale. GTX osiąga o 45% lepsze wyniki niż GTS.
Niestety, FEAR nie lubi być wygładzany - podczas renderingu pojawia się masa artefaktów - zresztą nie tylko na GeForce 8800.
Dla kart graficznych z pułapu cenowego powyżej 1000 zł, Half Life 2 'Lost Coast' nie stanowi żadnego poważnego wyzwania... ale zawsze można jeszcze włączyć mocniejsze wygładzanie krawędzi, a wówczas i jakość obrazu, i wyniki robią się o wiele ciekawsze. Niech nie umknie Wam tu istotny szczegół - testy wykonane są w rozdzielczości 1920x1200. Przy włączonym FSAA x16 i pełnym HDR, obraz na ekranie wygląda powalająco. W takiej rozdzielczości nie ma nawet sensu doszukiwać się na monitorze LCD subtelnych różnic w sposobie i technice wygładzania krawędzi.
GeForce 8800: 1920x1200, FSAA x16 + wygł. przeźroczyste, filtrowanie anizotropowe x16, Full HDR
kliknij aby zobaczyć w pełnych wymiarach
Testując najwydajniejsze karty graficzne jeszcze przed ukazaniem się G80, sądziliśmy, że Serious Sam 2 zapewni nam platformę testową jeszcze na dobre kilka miesięcy. W końcu 45 fps na GeForce 7900 GTX, bez włączonego FSAA, to przecież żadna rewelacja. Po pierwszym uruchomieniu benchmarka SS2 na 8800 GTS i GTX mieliśmy już jasność :) Tych kart po prostu nie da się niczym 'zajechać'. Musimy poczekać na nowe, nadchodzące tytułu jak 'Crysis', 'Supreme Commander', czy 'Hellgate London'. No i oczywiście DirectX 10.
Ale czas na największego 'karpika' ;) miał dopiero nadejść w chwili odpalenia 'Company of Heroes'. Z 'niesamowitych' 27 fps na GeForce 7900GTX, otrzymujemy 55, czyli dwa razy więcej!, na 8800 GTS. W rozdzielczości 1920x1200 grafika płynie niczym miód w upalne lato. Vanilla :]
GeForce 8800: jakość ULTRA, 1920x1200, FSAA x16, filtrowanie anizotropowe x16,
kliknij aby zobaczyć w pełnych wymiarach
Podsumowanie - część I: DX9
Po testach GeForce 8800 jeszcze przez jakiś czas ciężko nam będzie zejść na ziemię ;) Karty oferują niesamowite osiągi, nawet jeśli przeliczymy współczynnik wydajności do ceny, wypadają rewelacyjnie. Za 7900 GTX trzeba zapłacić 1800 zł (już wkrótce zapewne o wiele mniej), natomiast jedyna karta, która może choć trochę powalczyć z 8800GTS, czyli GeForce 7950 GX2, kosztuje prawie tyle samo. Wniosek jest oczywisty.
To tyle jeśli chodzi o testy DirectX 9 i Shader Model 3.0. Na sprawdzenie kart w środowisku DX10 przyjdzie nam pewnie jeszcze trochę poczekać, a wtedy kto wie, może G80 będzie musiał już wtedy stoczyć pojedynek z ATi R600.
Poczekamy też na nowe, bardziej wymagające gry napisane w DirectX 10, a wówczas będzie też okazja, aby przyglądnąć się uważniej jakości obrazu z wygładzaniem krawędzi i filtrowaniem anizotropowym.
To samo jeśli chodzi o pełną zgodność z HDCP (High-bandwith Digital Content Protection). Na tę chwilę możemy nvidii zawierzyć na słowo honoru, ale gdy przeprowadzimy pierwsze testy, od razu podzielimy się z Wami spostrzeżeniami. W sumie nie powinno być żadnych niespodzianek. Karta powinna mieć wbudowaną pamięć EEPROM oraz klucz HDCPii.
Na dzień dzisiejszy nie widzimy żadnych przeciwwskazań, aby wyłuskać trochę z zapasów oszczędności (jeśli takowe się ma), na nowego GeForce'a 8800 - ze wskazaniem na model GTS. Tym bardziej, że długie zimowe wieczory właśnie przed nami.