Szybciej, lepiej, mocniej ... sprytniej
4 maja 2004, 14 miesięcy po premierze swojego ostatniego procesora graficznego R350, firma ATI Technologies oficjalnie zaprezentowała swój kolejny VPU o kodowym oznaczeniu R420 i oparte na nim karty z serii RADEON X800. Nowy procesor jest tak na dobrą sprawę ponowym ulepszeniem potężnego silnika R300, który jako pierwszy w 2002 roku otworzył przed graczami erę DirectX 9. I być może to właśnie ta nauczka z pośpiesznego wprowadzania na rynek nowości, tym razem skłoniła firmę ATi jedynie do ulepszenia swojej dotychczasowej architektury (jeśli pamiętacie, Radeon 9700 który jako pierwszy obsługiwał DX9, na oficjalne wsparcie czekał prawie 6 miesięcy).
Tak więc zamiast projektować kolejny, zupełnie nowy chipset, ATi zdecydowało się do sprawdzonej architektury R350 dodać jeszcze dwa procesory vertexów, podwoić liczbę potoków renderujących, ulepszyć procesor pikseli oraz technologie odpowiedzialne za poprawę jakości obrazu - o których więcej już na kolejnych stronach. Te zmiany wystarczyły aby oddać graczom nowy VPU oferujący potężny wzrost wydajności - wyprzedzając nasze podsumowanie - nawet do 80% w stosunku do swojego poprzednika.
Przy podziale kart na kilka kategorii cenowych jak zwykle posłużono się starą sztuczką, zablokowaniem części potoków renderujących. W efekcie będzie można kupić Radeona X800 Pro z VPU dysponującym 12 potokami renderującymi, lub Radeona X800 XT ze wszystkimi 16 potokami. Aby określić maksymalną wydajność i różnicę pomiędzy takimi kartami, wystarczy przemnożyć liczbę potoków przez częstotliwość zegara VPU. Otrzymamy współczynnik "szybkości wypełniania" w Megapikselach na sekundę, na podstawie którego dowiemy się, że Radeon X800Pro może być do 70% szybszy od Radeon 9800XT, natomiast X800XT do 45% szybszy od 12 potokowej wersji X800 Pro.
| Radeon 9800 Pro | Radeon 9800XT | Radeon X800 Pro | Radeon X800XT | |
| nazwa kodowa GPU | R350 | R360 | R420 | R420 |
| technologia wykonania | 150nm | 130nm | ||
| Silnik graficzny | SMARTSHADER 2.1 Pixel Shader 2.0 Vertex Shader 2.0 | SMARTSHADER HD Pixel Shader 2.0 Vertex Shader 2.0 | ||
| procesory vertexów | 4 | 4 | 6 | 6 |
| wydajność geometryczna | 16 mld instr/s | 17.3 mld instr/s | 34 mld instr/s | 46 mld instr/s |
| liczba potoków | 8 | 8 | 12 | 16 |
| częstotliwość taktowania | 380 Mhz | 415 MHz | 475 Mhz | 525 MHz |
| wydajność wypełniania | 3040 MP/s | 3320 MP/s | 5700 MP/s | 8400 MP/s |
| pamięci | 680 MHz | 730 MHz | 900 MHz | 1120 MHz |
| przepustowość | ~21.1 GB/s | ~22 GB/s | ~29 GB/s | ~35 GB/s |
| szyna do pamięci | 256-bitowa DDR/DDR2 | 256-bitowa DDR3 | ||
| technologie | SMOOTHVISION 2.1 HYPER Z III+ VIDEOSHADER 2.1 | SMOOTHVISION HD HYPER Z HD VIDEOSHADER HD | ||
| RAMDAC | 2 x 400 MHz | 2 x 400 MHz | ||
Z tak olbrzymim skokiem w wydajności nie mieliśmy już do czynienia od czasu premiery Radeon 9700 Pro, zatem wymagający gracze powinny być naprawdę usatysfakcjonowani.
Jednak już w chwili premiery R420, na nowy produkt ATi padł cień najnowszego chipa nVidii. O tym, że procesor graficzny może być bardziej zgodny z DirectX 9 niż był dotychczas, przekonaliśmy się w chwili premiery nowego GPU rywala ATi. Nvidia w swoim NV40 zastosowała enigmatyczny ShaderModel 3.0 (model cieniowania w wersji 3.0), dający jej pełną obsługę DirectX 9.0c. Tym samym nowy chip ATi zyskał status produktu "technologicznie pozostającego w tyle za konkurencją". Sądząc po specyfikacji, nowy SM 3.0 może rzekomo wnieść duży potencjał w nowoczesne gry 3D, jednak kluczowym pytaniem nie jest w tej chwili: jak duży jest to potencjał, ale: kiedy będzie można zobaczyć jego efekty?
Jeśli nVidii uda się stosownym patchem wprowadzić obsługę SM 3.0 do bardzo popularnej ostatnio gry FARCRY, z pewnością zyską "marketingową" przewagę. Jeśli obsługa SM 3.0 pojawi się w DooM III i Half Life 2 (lub innej grze która zyska dużą popularność) przewaga nVidii będzie wyraźna. Ciągle jednak nie wiemy, jakie wymierne korzyści niesie ze sobą ShaderModel 3.0. Czy jest to funkcja, której gracze i programiści naprawdę potrzebują, czy jedynie narzędzie w wyścigu technologicznym, w walce o przewagę na rynku graficznym. Póki co nVidia stara się przekonać wszystkich, że SM 3.0 to znaczący krok do przodu w technologii renderingu 3D, zaś firma ATi rzecz jasna umniejszyć znaczenie tej funkcji.
Podobne zderzenia miały już miejsce w historii chipów graficznych, choć może nie na taką skalę. NV 25/27 nVidii obsługiwał PixelShader w wersji 1.3, podczas gdy układ R200 ATi realizował funkcje 1.4. Jakie to miało rzeczywiste znaczenie dla graczy - poza kilkoma ładnymi demkami - zapewne wszyscy doskonale wiemy. Szczegółowym omówieniem Modelu Cieniowania 3.0 zajmiemy się podczas naszej recenzji GeForce 6800, teraz przejdźmy już to prezentacji głównego bohatera tego artykułu.
Szczegółowa specyfikacja R420
Podobnie jak w każdym poprzednim procesorze firmy ATi, VPU jest podzielony na kilka sekcji: SMARTSHADER HD, w którego skład wchodzą programowalne jednostki geometryczne VertexShader 2.0 i programowalne procesory cieniowania PixelShader 2.0. SMOOTHVISION HD, część odpowiedzialna za wygładzanie krawędzi i filtrowanie tekstur. HYPER Z HD, mechanizm i algorytmy bufora-Z. VIDEOSHADER HD, jednostka przetwarzania i dekodowania potoku video.
Nowością jest tu technologia 3Dc, nowa metoda kompresji map tekstur, zapoczątkowana przez ATi właśnie w procesorze R420. Więcej szczegółowych informacji o tej technologii już na kolejnych stronach.
W nowym procesorze kluczową rolę odgrywają dodatkowe dwa procesory vertexów i dodatkowe potoki renderujące. To one w głównej mierze zapewniają karcie tak duży wzrost wydajności. Nowy proces technologiczny 0.13 mikrona "low-k", pozwolił zmniejszyć pobór prądu i tym samym wydzielanie ciepła. Te zaś umożliwiły podniesienie częstotliwości taktowania GPU, odpowiednio 475 i 525 MHz dla X800 Pro i X800 XT.
Kosmetycznym poprawkom poddano także procesor pikseli, w którym zwiększono liczbę rejestrów tymczasowych (Max Temp Storage) z 12 do 16, oraz wydłużono ilość instrukcji pixeli ze 160 do 1536.
Oto szczegółowa specyfikacja R420:
- 160 milionów tranzystorów, technologia wykonania 0.13 micron "low-k"
- do 16 potoków renderujących
- sześć programowalnych potoków Vertex Shader
- 256-bitowy interfejs do pamięci GDDR3
- obsługa AGP 8X
- SMARTSHADER HD
- pełna obsługa DirectX 9.0b i OpenGL 2.0
- programowalne jednostki Vertex Shader 2.0 i Pixel Shaders 2.0
- do 65,280 instrukcji Vertex
- Single cycle trigonometric operations (SIN & COS)
- rozszerzona obsługa Direct X 9.0b Pixel Shaderów
* do 1,536 instrukcji i 16 tekstur w jednym przejściu
* 2-giej generacji F-buffer przyspieszający wielo-wątkowość programów pixel shader
* 32 tymczasowych i stałych rejestrów
* rejestry dla dwustronnego oświetlenia
* 128-, 64- i 32-bitowa zmiennoprzecinkowa prezycja kolorów
* wsparcie dla Multiple Render Target (MRT)
- Anti-Aliasing w trybach 2x/4x/6x
- algorytm multipróbkowania z korekcją gamma,
- bezstratna kompresja koloru (6:1) we wszystkich rozdzielczościach,
- nowa metoda Anti-Aliasingu Temporal
- filtrowanie anizotropowe w trybach 2x/4x/8x/16x
- filtrowanie tekstur do 128-poziomów
- adaptacyjne filtrowanie dwuliniowe i trójliniowe
- wysokiej jakości kompresja map 4:1
- Works with any two-channel data format
- 3-poziomy hierarchiczny bufor-Z z wczesnym testem Z
- bezstratna kompresja bufor-Z (do 48:1)
- szybkie czyszczenie bufora-Z
- cache Z zoptymalizowany do renderowania cieni w czasie rzeczywistym
- przetwarzanie potoku video w jednostce pixel shaders
- FULLSTREAM - technologia ulepszania obrazu w formatach DivX i WMV9 (tak zwane usuwanie "pikselozy")
- VIDEOSOAP - usuwanie szumów z przechwytywanego potoku video
- wspomaganie przy dekodowaniu MPEG1/2/4
* obsługa DXVA
* sprzętowa komepnsacja ruchu (Motion Compensation), iDCT, DCT i konwersja koloru - dekodowanie wszystkich formatów DTV/HDTV
- podwójny zintegrowany (10-bitowy) RAMDAC 400 MHz DACs
- zintegrowany 165 MHzowy TMDS transmitter (DVI 1.0 / HDMI i HDCP)
Gigabyte GV-R80P256D - Radeon X800 Pro
Wyposażona w układ R420 (12 potokowy), taktowany częstotliwością 472 MHz, oraz 256MB pamięci GDD3 pracujących z częstotliwością DDR 446, czyli efektywne 890 MHz. Kości pamięci SAMSUNG (K4J55323QF-GC20) z czasem dostępu 2.0 ns.
Wyjścia: DVI 2.0, S-Video oraz klasyczne D-Sub. Z tyłu karty dodatkowe złącze zasilania molex 12V.
Gigabyte GV-R80X256V - Radeon X800 XT Platinium Edition
Wyposażona w układ R420 (16 potokowy), taktowany częstotliwością 526 MHz, oraz 256MB pamięci GDD3 pracujących z częstotliwością DDR 560, czyli efektywne 1120 MHz. Kości pamięci SAMSUNG (K4J55323QF-GC16) z czasem dostępu 1.6 ns.
Wyjścia: DVI 2.0, wejście i wyjście S-Video oraz klasyczne D-Sub. Wejście Video obsługiwane jest przez dodatkowy procesor ATi Rage Theater (umieszczony z tyłu karty - drugie zdjęcie)
Na końcu karty dwa dodatkowe złącza: zasilania molex 12V (fioletowe) i wizyjne (żółte).
ATi VPU R420 vs R350
Spójrzmy jeszcze na różnice pomiędzy starym i nowym procesorem. Pierwsza rzecz która rzuca się w oczy, to nowe przydomki przy nazwach technologii - zamiast numerycznego np: SmartShader 2.1, SMOOTHVISION 2.1, HYPER Z III+, jest teraz SmartShader HD, SMOOTHVISION HD, HYPER Z HD. No cóż, to nieco pokrętne i bardzo sprytne posunięcie ze strony ATi, bowiem firma nie ujawnia teraz relacji w stosunku do poprzedniego silnika graficznego. Gdyby trzymać się starej, numerycznej symboliki, mogło by się okazać, że wprowadzone ulepszenia zasługują jedynie na podniesienie oznaczenia do wersji 2.3, 2.4 itp. A to jak wiadomo, z punktu widzenia marketingowego nie wyglądało by dobrze. Tak więc w miejsce oznaczenia 2.3 mogło się pojawić cokolwiek. Pojawiło się coś, do czego można było dorobić dodatkową "filozofię", a więc HD czyli "High Definition".
Oznaczenie to ma wydźwięk tymbardziej marketignowy, bowiem nawiązuje to bardzo modnej technologii HDTV, czyli telewizji "wysokiej rozdzielczości".
Najbardziej znaczące różnice to nowa metoda kompresji map tekstur 3Dc, nowa metoda wygładzania krawędzi FSAA Temporal, poprawione algorytmy bezstratnej kompresji bufora Z, oraz sprzętowe dekodowanie MPEG-4.
Ciekawostką jest całkowite usunięcie ze specyfikacji TRUFORM, mimo, że w panelu sterowania sterowników X800 opcja Trueform jest nadal dostępna. Najwidoczniej firma ATi doszła do wniosku, że nie ma sensu dalej promować tej pseudo "technologii".
| Radeon 9800 | Radeon X800 | |
| Silnik graficzny (nazwa marketingowa) | Smartshader 2.1 | Smartshader HD |
| architektura procesora | 256 bitowa | 256 bitowa |
| Vertex Shader | 2.0+ | 2.0+ |
| wydajność Shaderów | 16 do 17.3 mld instr/s | 34 do 46 mld instr/s |
| Pixel Shader | 2.0+ | 2.0+ |
| wydajność wypełniania pikseli | 3 do 3.3 GigaPikseli/s | 5.7 do 8 GigaPikseli/s |
| zgodność z API | DirectX 9.0b OpenGL 1.5 | DirectX 9.0b OpenGL 1.5 |
| potoki renderujące [TMU w potoku] | 8 | 12 lub 16 |
| jednostki geometryczne | 4 | 6 |
| wydajność geometryczna | 380 do 412 mln vert/s | 712 do 750 mln vert/s |
| ilość tekstur w jednym przejściu | do 16 | do 16 |
| precyzja koloru | 128- 64- i 32-bitowa | 128- 64- i 32-bitowa |
| ilość instrukcji Pixel shader | do 160 | do 1,536 |
| ilość instrukcji Vertex shader | do 65,280 | do 65,280 |
| max obsługiwany format tekstur | 2048x2048 @32bpp | 2048x2048 @32bpp |
| kompresja tekstur | DXTn (S3TC) | DXTn (S3TC) 3Dc (4:1) |
| metody środowiskowego mapowania | Dot Product3 i EMBM | Dot Product3 i EMBM |
| nazwa marketingowa : | SMOOTHVISION 2.1 | SMOOTHVISION HD |
| pełno-ekranowe wygładzanie | 2x/4x/6x metodą multipróbkowania | 2x/4x/6x metodą multipróbkowania + metodą Temporal |
| filtrowanie anizotropowe | 2x/4x/8x/16x | 2x/4x/8x/16x |
| kontroler pamięci | 4 niezależne 64-bitowe kontrolery | 4 niezależne 64-bitowe kontrolery |
| nazwa marketingowa : | HYPER Z III+ | HYPER Z HD |
| kompresja koloru | tak | tak |
| szybkie czyszczenie Bufora Z | tak | tak |
| kompresja Bufora Z | tak (24:1) | tak (48:1) |
| usuwanie niewidocznych pikseli | tak | tak |
| dodatkowe technologie | TRUFORM 2.0 drugiej generacji N-Patch, tessellacja wielokątów, mapowanie przemieszczeń | TRUFORM (?) |
| złącze AGP | AGP 8X/4X | AGP 8X/4X |
| nazwa marketingowa : | VIDEOSHADER | VIDEOSHADER HD |
| RAMDAC | podwójny 400 MHz | podwójny 400 MHz |
| transmitter DVI | zintegrowany 165MHz (DVI 1.0) | zintegrowany 165MHz (DVI 1.0) |
| obsługa wyjścia TV | z GPU | z GPU |
| dodatkowe funkcje | FULLSTREAM VIDEOSOAP | FULLSTREAM VIDEOSOAP |
| Sprzętowe dekodowanie | MPEG-1, 2 | MPEG-1, 2, 4, |
| Wspomaganie dekodowania | kompensacja ruchu (MC) + iDCT | kompensacja ruchu (MC) + iDCT, DCT |
Double Cross i efekty 3D
Silnik graficzny SMARTSHADER HD oparty jest na jednostkach VertexShader 2.0 i PixelShader 2.0, zatem pod względem możliwości generowania obrazu 3D, nic nowego z jego strony nie możemy oczekiwać. W swoich demkach technologicznych firma ATi zaprezentowała nowe, bardzo efektowne zastosowania dla SMARTSHADER'a, ale oznacza to, że możliwe by były one również do uzyskania na starszym R350 (zapewne dużo wolniej, ale możliwe). Dziwi zatem fakt, że demka Double Cross w ogóle nie da się uruchomić na karcie Radeon 9800.
Zobaczmy teraz najciekawsze efekty 3D zaprezentowane w demku DoubleCross i realizowane przy użyciu nowego silnika R420.
Miekkie cienie - znaczenia nie trzeba chyba wyjaśniać. Krawędzie cieni są rozmyte, a dzięki temu rendering nabiera realizmu.
Głebia Pola - to technika wykorzystująca zasadę ogniskowej, czyli odległości pomiędzy punktem w głębi a punktem z którego "patrzymy" na scenę. Czytelnicy "ze stażem" prawdopodobnie doznają deja-vu. Owszem, podobny efekt już w 2000 roku zaprezentowała firma 3dfx w swojej karcie Voodoo5 5500, wówczas realizowany przez T-Buffer.
Po lewej punkt ogniskowej ustawiony na postaci i po prawej punkt ogniskowej ustawiony na tle.
Złożone odbicia i zatrzymania - efekt symulujący zmiany kierunków światła przy przechodzeniu przez przeźroczyste materiały, takie jak szkło, woda, lub wielki klejnot z demka Double Cross jak na obrazku poniżej - choć statyczny obrazek niestety nie oddaje całego piękna tej techniki.
Rozpraszanie podpowierzchniowe, zademonstrowane już w osobnym demku "Subsurface Scattering". Półprzeźroczyste, oświetlane obiekty, stawiają kolejny problem przed interaktywnym renderingiem (jeśli stwarzać sobie takie problemy...). Niektóre materiały rozpraszają światło gdy to przez nie przechodzi - jak np: marmur - dając mu miękki blask. Technika "rozpraszania podpowierzchniowego" wprowadza taki efekt do renderingu, a dobrze wykorzystana może przynieść świetne rezultaty.
A zatem w kolejnych grach możemy się spodziewać całej masy marmurowych figurek, lub pięknej wersji szachów 3D ;)
po lewej z rozpraszaniem podpowierzchniowym, po prawej bez
- ta sama figurka po zmniejszeniu w niektórych miejscach jest już półprzeźroczysta,
a więc światło nie będzie się odbijać, lecz również przenikać
3Dc i Temporal Anti-Aliasing
3Dc - którego twórcą jest ATi - jest nową metodą kompresji map wektorów normalnych. Kompresja taka - o współczynniku kompresji 4:1 - jak zwykle umożliwi zmniejszenie pliku z teksturą, czyli zwiększenie wydajności (oszczędzając na przepustowości pamięci), lub zwiększenie szczegółowości takiej tekstury, czyli większy realizm obiektów na które nakładana jest "mapa normalnych". ATi opracowało i zaproponowało nową metodę kompresji 3Dc, bowiem dotychczasowe techniki kompresji tekstur DTXC i S3TC, były nieskuteczne w kompresji "map normalnych".
Mapy normalnych są specjalnymi teksturami, których używa się do nadania szczegółów trójwymiarowym powierzchniom - dajmy na to głowy. Mogą być generowane poprzez stworzenie dwóch wersji tego samego modelu głowy: jednego z dużą liczbą wielokątów (np: 15,000 wielokątów) i drugą ze znacznie mniejszym poziomem geometrii (np: 1000 wielokątów). W modelu szczegółowym używa się maksymalnej liczby wielokątów, tak aby uchwycić wszystkie najmniejsze szczegóły twarzy, zaś uboższy model ma tylko tyle wielokątów, aby wystarczyło do ogólnego określenia kształtu obiektu. Następnie odpowiedni program oblicza wszystkie różnice pomiędzy punktami na powierzchni obu tych modeli i zapisuje to w postaci tekstury "map normalnych". .
Technika ta jest używana m.in. w grze FARCRY, ma być także stosowana w nadchodzących grach DooM III i HalfLife 2. Poniższy obrazek przedstawia przykład zastosowania tekstury "map normalnych" - przy założeniu, że plik z teksturą ma dokładnie tą samą wielkość.
tekstura o tej samej objętości, przy wykorzystaniu kompresji 3Dc, może mieć więcej szczegółów
SMOOTHVISION HD - podobnie jak jego poprzednik SmoothVision 2.1 - dysponuje bardzo wydajnym i wysokiej jakości narzędziem do wygładzania krawędzi tekstur. Używa do tego algorytmów dwu-, cztero- lub sześcio-krotnego multipróbkowania pixeli, ale może dodatkowo używać także różnych wzorców próbek (co ciekawe, technika dostępna już od GPU R300).
Temporal Anti-Aliasing - czyli czasowy Anti-Aliasing - to połączenie dwóch różnych wzorców próbkowania, które naprzemiennie stosowane są do kolejnych klatek obrazu. Zakładając, że obraz wyświetlany jest z szybkością większą niż 60klatek na sekundę (warunek włączenia czasowego AA), czyli z osobna nieuchwytnymi dla oka ludzkiego, przy ustawieniu Temporal AAX2 renderowany obraz zobaczymy z efektywnym wygładzaniem AAx4, itd Demonstruje to obrazek poniżej.
Trzeba przyznać, że to bardzo ciekawy i sprytny pomysł na zwiększenie efektywności AA. Sprytny, bowiem ciężko teraz "udowodnić" jego skuteczność i porównać do metody konkurenta. Praktycznie niewykonalne jest (a przynajmniej mało możliwe w sposób w jaki do tej pory to robiliśmy) zaprezentowanie jakości tego wygładzania na przechwyconych obrazkach, bowiem wymagałoby to złapania dwóch następujących po sobie klatek obrazu, a następnie nałożenie ich na siebie, aby dodać efekty próbkowania.
Warunkiem do aktywacji "czasowego wygładzania" jest włączona synchronizacja z odświeżaniem monitora (VSync). Biorąc pod uwagę, że najniższe możliwe odświeżanie ekranu wynosi 60 Hz (w przypadku monitorów CRT nawet 70 lub więcej), nie stanowi to większego ograniczenia dla wydajności, ale jest to kolejny "kruczek" uniemożliwiający ocenę "wydajności" Temporal Anti-Aliasing.
Panele sterowania sterowników
Z jednym małym wyjątkiem, w panelach sterownika nie zaszły żadne znaczące zmiany. A przynajmniej jeszcze nie zaszły w wersji CATALYST 4.6, na której testowaliśmy karty.
Tym wyjątkiem jest dodatkowa zakładka OVERDRIVE, pojawiająca się wyłącznie przy karcie X800XT, z której można włączyć automatyczne "podkręcenie" częstotliwości GPU, oraz śledzić jego temperaturę. W tym przypadku częstotliwość wzrosła nieznacznie, bo zaledwie o 7 MHz.
Platforma testowa
- procesor IntelPentium 4 3.2 GHz HT/FSB 800 MHz (Northwood)
- płyta główna Gigabyte 8IPE 1000Pro2 (intel 865PE)
- 512 MB RAM (2x256) DDR400 MHz / DualChannel
- dysk twardy Seagate Barracuda 80 GB Serial ATA
- Zasilacz Chieftec 360W
- Windows XP Pro PL SP1
- sterowniki: ATi CATALYST 4.6
testowane karty - Radeon 9800 Pro Gigabyte Maya II GV-R98P256D 256 MB
- Radeon X800 Pro Gigabyte GV-R80P256D 256 MB
- Radeon X800 XT Gigabyte GV-R80X256V 256 MB
sterowniki ATi Catalyst 4.6
Testy wydajności : 3D Mark 2003
3D Mark 2003 testujący kompleksowo wydajność całej karty, wskazuje na 60-70% przyrost wydajności nowego, 12-potokowego Radeona X800 Pro w stosunku do 8-potokowego 9800 Pro. W najbardziej wymagających scenach, jak test "Mother Nature", różnica ta dochodzi nawet do 80% To chyba całkiem niezły wynik ;)
Testy wydajności : 3D Mark 2003 + FSAA x4 i Aniso x16
Ten sam zestaw testów tym razem z włączonym FSAA X4 i filtrowaniem anizotropowym X16.
Testy wydajności : Vertex Shader i Pixel Shader
Test wydajności jednostek Pixel Shader wszystkich trzech kart (biorąc pod uwagę, że są to silniki tej samej klasy 2.0) pokrywa się z syntetycznymi obliczeniami szybkości wypełniania pikseli, a więc liczby potoków renderujących pomnożonej przez częstotliwości taktowania GPU.
Kolejne dwa procesory vertexów dają serii X800 około 70% przyrost wydajności geometrycznej. Z 19 miliardów instrukcji na sekundę (SMARTSHADER 2.1), wydajność SMARTSHADER HD skoczyła do 34-35 miliardów instrukcji.
Testy wydajności : Aquamark 3
Jak się okazuje, nie we wszystkich grach będzie można zanotować tak olbrzymi wzrost wydajności. W Aquamark3 różnica w stosunku do Radeona 9800 Pro wynosiła zaledwie 20-30%. Dopiero w rozdzielczości 1280x1024 model X800XT wyprzedził go aż o 50%, zaś X800 Pro o 35%.
Jednak wyniki X800XT - bardzo zbliżone we wszystkich trzech rozdzielczościach - nieco wzbudziły nasze wątpliwości, czy aby w sterownikach nie ma jakiegoś ograniczenia. Testy przeprowadzaliśmy z wyłączoną synchronizacją (co zresztą potwierdzają wyniki z 3D Mark 2003), mimo to, rezulataty wyglądały tak, jak gdyby VSync było włączone.
I ten sam test z włączonym FSAA X4 i filtrowaniem anizotropowym X16. Jak widać największe korzyści z nowych Radeonów X800 można wydobyć dopiero od rozdzielczości 1280x1024 wzwyż.
Testy wydajności : FARCRY
Czy to ograniczenia silnika samej gry, czy też ustawienia w sterownikach ATi powodowały, że w naszym testowym demku karty nie mogły pokonać bariery 60 fps. Ale bynajmniej nie było to ograniczenie wynikające z włączonej VSync, bowiem w innych, mniej skomplikowanych scenach, karty osiągały również od 80 do 100 fps.
Dopiero przy dodatkowym obciążeniu kart włączonym FSAA X4 i filtrowaniem anizotropowym X16, ukazała się różnica w wydajności. Dla X800 XT praktycznie nie miało znaczenia, czy renderuje obraz z włączonym czy wyłączonym FSAA. Efekt był taki sam: płynne 50 fps nawet w rozdzielczości 1280x1024, a jakość obrazu bajeczna.
DVI / DSub / TVout
Jeśli chodzi o kwestie związane z obsługą wyjścia TV, trybu dwumonitorowego oraz możliwości zarządzania pulpitami, w kartach X800 nie pojawiło się nic nowego. W tej dziedzinie chyba już trudno wymyślić coś nowego.
1) Obsługa wyjścia TV S-Video
| Radeon 9800 | Radeon X800 | |
| koder do obsługi wyjścia TV | zintegrowany w GPU | zintegrowany w GPU |
| aktywacja wyjścia Video bez restartowania PC | tak | tak |
| maksymalna rozdzielczość na TV | 1024x768 | 1024x768 |
| tryb DualView na monitorze i TV | tak | tak |
| niezależna rozdzielczość i odświeżanie na TV | tak | tak |
| pulpit na monitorze + video pełnoekranowe na TV | tak | tak |
| video na całej powierzchni - usuwanie czarnej ramki | tak | tak |
2) Praca w trybie dwumonitorowym
| Radeon 9800 | Radeon X800 | |
| aplikacja zarządzająca trybem DualView | ATi Hydravision | ATi Hydravision |
| możliwość podpięcia dwóch monitorów CRT | tak | tak |
| możliwość podpięcia monitora CRT i LCD | tak | tak |
| możliwość podpięcia dwóch monitorów LCD | tak | tak |
| sprzętowe skalowanie obrazu do rozdzielczości LCD | tak | tak |
| niezależne rozdzielczości i odświeżanie na każdym z monitorów | tak | tak |
| rozciąganie pulpitu w poziomie | tak | tak |
| rozciąganie pulpitu w pionie | tak | tak |
| klonowanie obrazu na monitorach | tak | tak |
| pulpit na 1 ekranie, video pełnoekranowe na 2 | tak | tak |
| zamiana pulpitów 1 i 2 miejscami | tak | tak |
| rozciąganie okien aplikacji na dwa ekrany | tak | tak |
| definiowanie pojawiania się ramek dialogowych | tak | tak |
| obracanie obrazu o 90 i 180° | tak | tak |
| możliwość tworzenia wirtulanych puliptów | tak | tak |
Podsumowanie
Więcej potoków renderujących, więcej procesorów geometrii, wyższe częstotliwości taktowania, wyższa przepustowość pamięci, kosmetyczne poprawki w procesorach Pixel Shader i dwie nowe, świetnie zapowiadające się technologie: kompresja 3Dc i Temporal AA.
Nowy silnik graficzny ATi być może nie zaskakuje nowościami technologicznymi, ale oferuje potężny wzrost wydajności, który każdy z graczy bezpośrednio może przełożyć na poprawę jakości obrazu, włączając wygładzanie krawędzi (FSAA) i maksymalne filtrowanie tekstur.
Czy nowy Radeon X800 przetrwa presję nVidii związaną z brakiem ShaderModel 3.0, przekonamy się z upływem czasu. Z pewnością firmie ATi będzie teraz znacznie trudniej rywalizować z nVidią, która jej nowym produktom dokleja plakietkę "technologicznie pozostających w tyle za konkurencją". Już wkrótce zaprezentujemy recenzje kart GeForce 6800, a zaraz po nich dokonamy bezpośredniego starcia obu kart. Być może do tego czasu doczekamy się zapowiadanej na początek lipca premiery DooM III.
Czy warto wymieniać Radeona 9800 Pro na nowego X800 Pro? Jeśli ten pierwszy nie zaspokaja już naszych wymagań, zdecydowanie tak. Bardzo wysoka wydajność nowych X800 pozwoli wreszcie na komfortowe korzystanie z pełnoekranowego wygładzania krawędzi FSAA i ustawienie filtrowania anizotropowego na maksymalny poziom.
Zdecydować się na X800XT czy X800 Pro? Jak widać poniżej, znaczna przewaga tej pierwszej zauważalna będzie przede wszystkim w rozdzielczości 1280x1024 i wyższej, przy włączonym FSAA. Zważywszy na nieskromną cenę, kartę tę polecamy już wyłącznie największym entuzjastom.
Ostatecznie można uznać Radeony X800 za dobry, choć nie rewolucyjny produkt.