Premiera nowej grafiki nVidii GT200. Testujemy GeForce GTX 280

Nowa oferta NVIDII skierowana jest do osób nie uznających żadnych kompromisów, oraz do tych, dla których wysupłanie pokaźnej sumy, za najmocniejszy w danej chwili układ graficzny, nie stanowi żadnego problemu. 1,4 miliarda tranzystorów, 240 rdzeni procesorowych SP, 32 jednostki renderujące ROP, wydajność zmiennoprzecinkowa 933 GigaFlopów/s, 512-bitowy kontroler pamięci z przepustowością 138 GB/s. Do tego PureVideo HD drugiej generacji, oraz technologia zaawansowanego zarządzania energią o nazwie HybridPower.

Sebastian Swarcewicz

15 czerwca 2008, 22:00

GeForce GTX 280

Od ostatniej premiery najwydajniejszej obecnie karty graficznej na rynku - GeForce 9800GX2 - mijają właśnie 3 miesiące, a NVIDIA sypie jak z rękawa kolejnymi konstrukcjami skierowanymi w ten segment.

Jak ogólnie wiadomo, premiera kart opartych o nowy chipset GT200 została nieco przyspieszona. Powodem takiego stanu rzeczy stała się zapowiedź wprowadzenia już za nieco około tydzień, nowej rodziny kart konkurującego obozu ATi/AMD, opartych o rdzeń kolejnej generacji - RV770.

Według wczesnych zapowiedzi, kolejne jednoprocesorowe karty ATi raczej nie zagrożą pozycji lidera, skierowane są bowiem do bezpośredniej "walki" z segmentami nieco niższymi, w których znajdują się karty oparte o bardzo udany, ale już nieco leciwy rdzeń G92 - występujący między innymi na GeForce 8800GTS 512MB oraz 9800GTX. Co to oznacza dla nas, nie trzeba chyba nikomu szczególnie tłumaczyć. Spadek cen starszej generacji układów GeForce z półek high-mid, oraz mainstram-high staje się coraz bardziej realny.

Jeżeli chodzi o nowości od NVIDII, póki co będziemy mieć dostęp do najpotężniejszych układów jednoprocesorowych, ale tym samym najdroższych rozwiązań na rynku.

Przy okazji premiery NVIDIA kolejny raz zmieniła system oznaczeń swoich produktów. Tym razem zrezygnowano z dodatkowych sygnaturek GS, GT czy GTX umieszczanych na końcu numeracji rodziny karty, na rzecz systemu liczbowego, znanego już z marketingowych oznaczeń ATI Radeon. Nową rodzinę otwierają właśnie tak oznaczone produkty, a więc GeForce GTX 260 oraz GTX 280. Jak nie trudno się domyśleć, ten pierwszy jest układem nieco słabszym, chociaż jego wydajność może oscylować nieco powyżej mającego się dopiero ukazać Radeona HD4870. Ten drugi będzie prawdziwym topem, zarówno jeżeli chodzi o parametry jak i prezentowany "performance".

Nowa oferta NVIDII skierowana jest więc do osób nie uznających żadnych kompromisów, oraz do tych, dla których wysupłanie pokaźnej sumy, za najmocniejszy w danej chwili układ graficzny, nie stanowi żadnego problemu.

Architektura GT200 w pigułce

Układ GT200 pod względem architektury i wykorzystania Stream Procesorów należy do drugiej generacji Unified Shader (zunifikowanych shaderów). W dalszym ciągu karta wspiera jednak komunikację z aplikacjami poprzez standardy API DirectX10 oraz OpenGL 2.1. Wydawało by się, że dzięki temu nie uświadczymy żadnej większej rewolucji, jednak wprowadzone usprawnienia w potokach wykonawczych mają wg producenta znacznie przyspieszyć przetwarzanie kodu zgodnego z Shader Model 4.0, a tym samym na bardziej efektywne wykorzystanie środowiska DirectX10.

nagi GT200, czyli zdjęcia rdzenia pod mikroskopem elektronowym�

Rdzeń GT200 składa się z około 1,4 miliarda tranzystorów, czyli prawie dwukrotnie więcej aniżeli miało to miejsce w układach serii G92, oraz ponad dwukrotnie więcej od G80. Zwiększenie liczby tranzystorów budujących układ nie bierze się z niczego. Ilość miejsca potrzebna do "wciśnięcia" 240-tu SPu, większej ilości pamięci podręcznej, szerszego kontrolera pamięci (512-bit) oraz większej ilości jednostek ROP i TF musi znaleźć ujście. Warto jednak zauważyć iż sam rdzeń, produkowany przez fabrykę TSMC w wymiarze technologicznym 65nm zajmuje przy tym "zaledwie" 576mm2. Jest zatem większy od poprzedniego "potwora" G80 o tylko i aż 95mm2.

TPC

Zarówno pierwsza generacja zunifikowanej architektury o strukturze Scalable Processor Array (SPA) jak i jej rozszerzenie w GT200, zbudowane zostały w oparciu o klastry (bloki wykonawcze). Dzięki dodatkowym optymalizacjom w GT200, bloki te mogą pracować jako TPC czyli "Texture Processing Clusters" w trybie przetwarzania grafiki (Graphics processing mode) lub TPC "Thread Processing Clusters" w trybie przetwarzania równoległego (Parallel compute mode).

Każdy klaster TPC zawiera pewną liczbę tzw. "streaming multiprocessors" (SM), w których znajduje się po 8 "rdzeni procesorowych" SP (dawniej wg nomenklatury stream procesorów). I tu dochodzimy do sedna. Podstawową różnicą jaką dzieli obydwie rodziny kart GeForce będzie, nie tyle liczba klastrów TPC ( 10 w stosunku do 8 ), co przede wszystkim liczba bloków multiprocesorowych (SM) przypadających na pojedynczy klaster. W GeForce 8 i 9 mieliśmy 2 takie bloki, w GeForce GTX 260/280 są już po 3. Z prostego rachunku wychodzi nam zatem: 10 TPC * 3 bloki SM * 8 pojedynczych rdzeni SP, co daje całkowitą sumę w ilości 240 jednostek przetwarzających SP.

Ponadto w każdym klastrze TPC znajduje się po 8 jednostek filtrujących tekstury, a więc całościowo równa się to liczbie 80-u TF/TA. Cały klaster do ROPów (render operation processors) "przyłączony" jest przy pomocy pamięci podręcznej drugiego poziomu (Tex L2 cache). Ale tylko w przypadku korzystania z TPC jako "Texture Processing Units", czyli operacji na grafice. Drugi przypadek (wykorzystanie skalowalności architektury) to TPC jako "Thread Processing", czyli przetwarzanie równoległe (wielowątkowość) znane doskonale z procesorów CPU. To także duża zmiana jeżeli chodzi o elastyczność nowego rdzenia.

- Parrallel Computing Architecture

Przetwarzanie równoległe, przy wykorzystaniu TPC w roli "Thread Processing Clusters" (klastrów wątków) jest obecnie o wiele łatwiejsze i efektywniejsze niż miało to miejsce do tej pory. W każdym z bloków multiprocesorowych (SM) do komunikacji i wymiany danych pomiędzy pojedynczymi "rdzeniami procesorowymi" wykorzystywana jest szybka pamięć dzielona tzw. "Local Memory", bez niepotrzebnego angażowania do zapisu, lub odczytu podsystemu pamięci zewnętrznej. Charakter tej otwartej architektury, predyscynuje do wykorzystania możliwości jakie do tej pory zarezerwowane były tylko dla procesorów centralnych. I tu z pomocą przychodzi środowisko NVIDIA CUDA (Compute Unified Device Architecture), dzięki któremu nieużywane do generowania grafiki rdzenie procesorowe SP, zostaną zaangażowane do pracy przy bardziej pożytecznych np. dla nauki obliczeniach.

Architektura SIMT

Operacje graficzne oraz obliczenia wielowątkowe używają dwóch różnych modeli przetwarzania. Do wykonywania poleceń w strukturze klastra TPC używana jest architektura instrukcji MIMD (multiple instruction, multiple data); do wykonywania poleceń w obrębie samych bloków SM używana jest architektura SIMT (single instruction, multiple thread). W odróżnieniu od architektury SIMD (single instruction, multiple data), skalarny SIMT nie potrzebuje jednak do obliczeń pobierać parametrów szerokości wektora, stąd operacje mogą teraz przebiegać znacznie szybciej (pomijanie tej wartości w przebiegu). Dzięki architekturze SIMT jednostki SP w układzie przetwarzania wątków mogą być przez cały czas w pełni wykorzystywane. Zapewnia to także łatwiejszą programowalność i bardziej efektywne wykorzystanie stream procesorów do wymaganych obliczeń.

Dzięki znacznym usprawnieniom w architekturze bloków SM, 20% wydajniejszym"schedulerze" rozkazów oraz multiwątkowemu zestawowi instrukcji SIMT, układ potrafi w locie przetworzyć ponad 30.000 wątków, co w porównaniu z nieco ponad 12.000 możliwymi do wykonania jednoczesnymi wątkami przez układ G80 (8800GTX) wydaje się ogromnym usprawnieniem.

Larger Register File

Przestrzeń przeznaczona dla przetrzymywania pliku rejestru w bloku SM, została również podwojona względem serii GeForce 8 i 9. W starszej serii układów, zbyt długi program shaderowy powodował konieczność przenoszenia części danych do pamięci (plik wymiany). W GT200 wykorzystanie znacznie dłuższych i bardziej złożonych programów shaderowych jest nie tylko możliwe, ale i zdecydowanie bardziej efektywne.

Double Precision

Jedną z najważniejszych zmian w nowej architekturze układu GT200, jest podwojona, 64-bitowa precyzja obliczeń zmiennoprzecinkowych (double precision). Dzięki takiemu rozwiązaniu na GPU będzie można bez przeszkód dokonywać złożonych obliczeń, które wymagają wysokiej precyzji i dokładności pomiarów, np. aplikacje naukowe, inżynierskie, czy finansowe. Dla przykładu wydajność pojedynczego rdzenia GT200 jest porównywalna, mniej więcej z dwoma czterordzeniowymi procesorami Xeon. 64-bitowa precyzja floating-point GT200 jest także zgodna z normą IEEE 754R.

Usprawnienia dotknęły ponadto nie tylko samych bloków wykonawczych, ale również wszystkich pozostałych elementów logiki układu:

usprawniono Dual Issue w SFU (Special Funktion Units) - specjalne funkcje matematyczne (zmiennoprzecinkowe) realizowane przez jednostki SM przy pomocy instrukcji MUL, MADD, oraz ADD
podniesiono wydajność jednostek TF w zakresie filtrowania tekstur w trybach bilinearnym oraz anizotropowym. Zmierzona poprawa prędkości filtrowania, przypadająca na jeden cykl zegara, względem układu G92 wynosi około 22%.
usprawniono pracę jednostek ROP, które zdolne są obecnie do przetwarzania i mieszania 32 pikseli na zegar. W starszej generacji możliwości te ograniczone były do przetworzenia 24 oraz mieszania (blending) 12 pikseli w jednym cyklu. Nowe rozwiązanie posiada zatem wymierny wpływ na wydajność antyaliasingu w połączeniu z oświetleniem HDR.
usprawniono prędkość przetwarzania geometry shadera oraz komunikacji z buforem Stream Out
podniesiono wydajność w zakresie kompresji bufora głębokości, w tym także funkcji Z-cull
zastosowano bardziej efektywny sposób komunikacji z systemem (usprawnienie komunikacji na drodze hardware - sterownik)

Spojrzenie na konstrukcje referencyjne

Tym razem nvidia dla obydwu kart zastosowała ten sam moduł chłodzenia. Różnice z zewnątrz ograniczają się jedynie do kolorystyki (jeżeli o takowej można w ogóle mówić). GTX w wersji 280 wydaje się bardziej "czarny" i właściwie jest to cała różnica na jaką się natkniemy. Niestety, póki co nie było możliwości rozkręcenia obydwu modeli i porównania zestawu chłodzenia występującego na referencyjnych konstrukcjach. Wydaje się jednak, że istotnych różnic raczej i tu nie uświadczymy.

NVIDIA GeForce GTX 260

- nvidia GeForce GTX 280

Długość całej karty (zabudowy) jest niemal identyczna jak w przypadku 9800GX2. Referencyjny system chłodzenia stosowany w kartach opartych o GT200, przez zewnętrznych producentów nie będzie zapewne poddawany żadnym modyfikacjom, stąd w sprzedaży powinny pojawić się mniej "trumiennie" wyglądające modele, które odróżnić będzie można jedynie po kolorowych naklejkach właściwych dla danego producenta.

Jeżeli chodzi o sam wentylator, którym uraczyła nas nvidia, jest to po prostu kolejna wariacja w temacie GeForce z górnej półki, przez co do najcichszych nie należy. Trzeba jednak przyznać, że do schłodzenia tego "potwora" potrzeba znaczącego przepływu powietrza. Więcej na ten temat w dalszej części artykułu.

GTX 200 series (tył obydwu kart)

Karta oglądana z tyłu prezentuje się bliźniaczo podobnie do GeForce 9800GX2, mamy więc tu ponownie kompletną zabudowę płytki drukowanej (tzw. "puszkę") wyposażoną w poprzeczne nacięcia ułatwiające odprowadzanie gromadzonego ciepła z górnej części PCB.

wyjścia w serii GT200

po lewej GeForce 9800 GTX, po prawej GeForce GTX 280

Standardowy komplet wyjść. Dwa złącza DVI-I z obsługą HDCP oraz wyjście HDTV-out (S-video). HDMI jest również dostępne, jednak potrzebna będzie specjalna przejściówka. Wersje produkcyjne niektórych kart powinny już zostać wyposażone w złącze HDMI wbudowane pod śledzia. Co bardzo istotne karty obsługują najnowszy dostępny tryb przesyłania obrazu poprzez interfejs DisplayPort, z tą jednak różnicą (w kontekście porównania ze starszą serią GeForce 8 i 9), że tym razem będzie można przesłać obraz w rozdzielczości ponad 2560x1600 i 10-bitowym kolorze (do miliarda barw na jednym ekranie). Poprzednie generacje kart również wewnętrznie operowały na 10-bitach, jednak na wyjściu musiały być już zgodne z formatem (RGB) czyli 8-bitami na kanał.

Nowa rodzina kart: GTX 260 / GTX 280

Nową rodzinę najwydajniejszych kart nvidii otwierają dwa GTX'y numerowane jako 260 oraz 280. Obydwie karty zbudowano wokół tego samego układu, jakim jest GT200.

GTX 280 jako prawdziwy top dla entuzjastów wydajności, posiada pełen, nienaruszony cięciami w architekturze rdzeń GT200. Zawiera on zatem 240 rdzeni procesorowych SP, 32 jednostki renderujące ROP oraz 80 jednostek filtrujących tekstury (TF).

Dzięki większej ilości jednostek ROP/TF karta dysponuje także wyższym od starszych GTX'ow współczynnikiem wypełniania, który wynosi tu 48160 MegaTekseli/s. Zegar taktujący domenę ROP został ustalony na dosyć bezpiecznym poziomie i wynosi 602MHz. Biorąc jednak pod uwagę złożoność rdzenia GT200, jej taktowanie wydaje się w zupełności wystarczające.

Dużo większy wpływ na wydajność w dzisiejszych grach będą mieć zegary procesorów strumieniowych. Różnica w taktach pomiędzy domeną shader a ROP wynosi 2.16, co daje 1296MHz na Stream Procesorach i przy 240 SPu oferują one maksymalną wydajność zmiennoprzecinkową na poziomie 933 GigaFlopów. Jak na pojedynczy rdzeń, zbliżenie się do wydajności 1TeraFlopa jest ogromnym krokiem naprzód.

Wbudowany kontroler pamięci posiada szerokość 512-bit i przy zegarze 1107 MHz dla pamięci GDDR3 posiada górną przepustowość na poziomie aż 138 GB/s. Niepokojącym, na pierwszy rzut oka, parametrem na który warto zwrócić uwagę jest wartość TDP (Thermal Design Power), wynoszący aż 236W dla tej topowej konstrukcji. Do tego wątku postaram się jeszcze powrócić w dalszej części artykułu przy omawianiu temperatury pracy tej karty.

	GeForce 8800GTX	GeForce 9800GTX	GeForce 9800 GX2	GeForce GTX 280
nazwa rdzenia	G80-300	G92-420	2x G92-450	GT200
technologia	90nm	65nm	65nm	65nm
licz. tranzys. powierz. rdzenia	681 mln 484 mm2	754 mln 324 mm2	754 mln 324 mm2	1.400 mln 576 mm2
maksymalne TDP	177 W	160W	210W	236W
jednostki ROP jedn. adresuj. TA jedn. Teksturujące	24 32 TF 64	16 64 64	2 x16 2x 64 2x 64	32 80 80
jednostki SP	128	128	2x 128	240
zegar GPU	575 MHz	675 MHz	600 MHz	602 MHz
wydajność wypełniania	36 800 MT/s	43 200 MT/s	76 800 MT/s	48 160 MT/s
częstotliwość shaderów	1357 MHz	1688 MHz	1500 MHz	1296 MHz
wydajność zmienn.	521 GFlops	648 GFlops	1152 GFlops	933 GFlops
zegar pamięci	DDR 900 MHz ef. 1800 MHz	DDR 1100 MHz ef. 2200 MHz	DDR 1000 MHz ef. 2000 MHz	DDR 1107 MHz ef. 2214 MHz
przepustowość pamięci	~84 GB/s	69 GB/s	2x 63 GB/s	138 GB/s
ilość i typ pamięci	768 MB GDDR 384-bit	512 MB GDDR 256-bit	2x 512 MB GDDR 256-bit	1024 MB GDDR3 512-bit
magistrala	PCI-E 16x 1.0/1.1	PCI-E 16x 2.0	PCI-E 16x 2.0	PCI-E 16x 2.0
chłodzenie	dwuslotowe	dwuslotowe	dwuslotowe	dwuslotowe
sprzętowe HD	tak PureVideo HD VP1	tak PureVideo HD VP2	tak PureVideo HD VP1	tak (PureVideo HD 2nd gen) VP3
multi-GPU	SLI	Tri-SLI	SLI	Tri-SLI
dodatkowe zasilanie	2x 6pin	2x 6pin	1x 6pin 1x 8pin	1x 6pin 1x 8pin

Nieco słabszy GTX 260, bazuje na zablokowanym częściowo układzie GT200. Praktyka zatem identyczna jak w przypadku ostatniej serii kart opartych o układy G92, a także G80. W przypadku GTX 260 aktywnych pozostało 192 rdzeni procesorowych, 28 ROP'ów oraz 64 jednostki filtrujące, przy jednoczesnym "okrojeniu" szyny pamięci do 448-bit.

Całość najbardziej przywołuje analogię do podobnych cięć znanych właśnie z G80, gdzie oprócz ingerencji "chirurgicznej" w jednostki wykonawcze, zablokowano część szyny pamięci oraz jej maksymalną obsługiwaną ilość. Tu jest podobnie, GTX 260 posiada już "tylko" 896MB pamięci GDDR3.

Dzięki mniejszej ilości TF oraz ROP współczynnik wypełniania spadł, w stosunku do GTX 280, do poziomu 36864 Megatekseli/s. Pomimo tego, jest to wartość znacznie przewyższająca starego 8800 GTS'a 640MB oraz nieco młodsze 8800GT, i jak widzimy niemal identyczna co przy leciwym już 8800GTX'ie. TDP dla tej karty ustalono na poziomie 186W, co jest wartością w stosunku do "silniejszego" brata o 50W niższą. Różnica na pewno niebagatelna.

	GeForce 8800 GTS 640	GeForce 8800 GT 512	GeForce GTX 260
nazwa rdzenia	G80-100	G92-270	GT200
technologia	90nm	65nm	65nm
licz. tranzys. powierz. rdzenia	681 mln 484 mm2	754 mln 324 mm2	1.400 mln 576 mm2
maksymalne TDP	147W	110W	186W
jednostki ROP jedn. adresuj. TA jedn. Teksturujące	20 24 TF48	16 56 56	28 64 64
jednostki SP	96	112	192
zegar GPU	500 MHz	600 MHz	576 MHz
wydajność wypełniania	24 000 MT/s	33 600 MT/s	36 860 MT/s
częstotliwość shaderów	1180 MHz	1500 MHz	1242 MHz
wydajność zmienn.	340 GFlops	506 GFlops	715 GFlops
zegar pamięci	DDR 800 MHz (ef. 1600 MHz)	DDR 900 MHz (ef. 1800 MHz)	DDR 1000 MHz ef. 2000 MHz
przepustowość pamięci	62 GB/s	56 GB/s	109 GB/s
ilość i typ pamięci	640 MB GDDR 320-bit	512 MB GDDR3 256-bit	1024 MB GDDR3 512-bit
magistrala	PCI-E 16x 1.1	PCI-E 16x 2.0	PCI-E 16x 2.0
chłodzenie	dwuslotowe	jednoslotowe	dwuslotowe
sprzętowe HD	tak PureVideo HD VP1	tak PureVideo HD VP2	tak (PureVideo HD 2nd gen) VP3
multi-GPU	SLI	SLI	Tri-SLI
dodatkowe zasilanie	1x 6-pin	1x 6-pin	1x 6pin 1x 8pin

Obydwie konstrukcje obsługują technikę łączenia ze sobą maksymalnie trzech kart (dwa złącza Scalable Link Interconnect) oraz potrafią skorzystać z dobrodziejstw zaawansowanego zarządzania energią o nazwie HybridPower. W przypadku tak prądożernych konstrukcji, dla naszego portfela, może się to okazać zbawienne.

ZASILANIE

po prawej gniazdka zasilania na karcie GeForce GTX 280, po lewej geForce 9800 GTX

Jeżeli chodzi o zasilanie, oprócz energii dostarczanej przez złącze krawędziowe z portu PCI-E 2.0, karty potrzebują "dokarmienia" dwiema dodatkowymi wtyczkami 6-pin PEG (w przypadku GTX 260), oraz 6-pin / 8-pin PEG w przypadku GTX 280. Jeżeli nasz zasilacz nie posiada "natywnej" wtyczki 8-pin, nic straconego, stosowne przejściówki znajdują się w zestawie z kartą.

"Przebudowane" zostało także PureVideo HD drugiej generacji. Jednoczesna obsługa dwóch źródeł wideo wysokiej rozdzielczości, oraz pełne wsparcie dla formatów H.264 i VC-1, oferują nieco bardziej rozszerzoną funkcjonalność w stosunku do możliwości układu G94-300 (9600GT).

PureVideo HD 2nd gen /VP3:

Hardware decode acceleration for H.264, VC-1 and MPEG2
Image post processing
Dynamic contrast enhacement
Blue, green and skin tone enhacements
HD dual-stream decode
Windows Vista Aero with Blue-ray movie playback
Full score for HQV and HQV HD

Temperatura pracy GTX 280

Do testów dotarła obecnie tylko jedna karta - referencyjny GeForce GTX 280. Na wstępie warto wspomnieć o nieco przerażającym parametrze TDP (Thermal Design Power), którym została ona obarczona przez producenta. Wynoszący aż 236W TDP jest podawany dla warunków laboratoryjnych, stąd realna wartość poboru energii podczas najbardziej wymagających obecnie gier powinna okazać się nieco niższa.

Jako że mamy do czynienia z wersją przedprodukcyjną nie będę się w tym teraz zanadto zagłębiać. Przy okazji testów wersji sklepowych do tego tematu będzie trzeba powrócić, ponieważ jest to jedna z najważniejszych dla użytkowników kwestii i takie pomiary wykonać po prostu trzeba.

Póki co możemy posiłkować się danymi podawanymi przez nvidię, z których jasno wynika iż poczynione usprawnienia w zarządzaniu energią (wyłączanie nieużywanych bloków GPU) powodują, że podczas pracy w środowisku 2D, czy też odtwarzania wideo realny pobór energii przez kartę jest wręcz niewiarygodnie niski. Dodatkowo, w przypadku korzystania z płyt obsługujących technologię HybridPower (seria chipsetów nForce 780a/790i) istnieje możliwość całkowitej "prądowej" deaktywacji karty, a tym samym jej wyłączenie na czas wyświetlania scen 2D.

Wg producenta karty GTX 260 / 280 obsługują 4 tryby dynamicznego zarządzania energią:

Idle / 2D Power mode - Tryb 2D /tzw spoczynek ~25W
Blue Ray / DVD Playback mode - Tryb odtwarzania materiału video ~35W
full 3D performance mode - Tryb 3D /tzw pełne obciążenie < 236W (TDP)
HybidPower mode - 0W

Czy rzeczywiście jest możliwe, aby NVIDII udało się tak efektywnie wyłączać poszczególne bloki/klastry w GPU, ograniczając przy tym tak drastycznie pobór energii przez całą kartę?

Wydaje się to, mimo wszystko, mało prawdopodobne i kolejnym razem trzeba będzie sprawdzić również i te rewelacje.

Wracając do naszego głównego bohatera, czyli GeForce GTX 280, trudno było przy tej wydajności spodziewać się urządzenia nadzwyczaj cichego, czy chłodnego i tak też jest w rzeczywistości. Karta nagrzewa się dość znacznie w stosunkowo krótkim czasie, przez co referencyjny wicherek ma wciąż "pełne ręce roboty". Domyślnie, minimalne jego obroty ustalone zostały na poziomie 40% (1000RPM) i dalej dzięki autokontroli wędrują do końca skali, czyli 100% (1600RPM).

jak osiągnąć temperaturę wrzenia w minutę - 40% prędkości obrotowej wentylatora w akcji

Podczas próby wymuszenia pracy przy 40% prędkości obrotowej wiatraka, karta bardzo szybko się przegrzewała (temp threshold "wartość progowa temperatury" dla GT200 wynosi 105°C). Temperatura wzrastała niemal liniowo, stąd trzeba było przywrócić kontrolę automatyczną. Wniosek - cicho niestety nie będzie. Już 50% prędkości powoduje dosyć nieprzyjemny szum, który podczas stopniowego nagrzewania narasta. Podczas intensywnej gry wentylator pracuje na 100% swoich możliwości, a wydobywający się szum bardzo przypomina "suszarkę" montowaną w Radeonach 2900XT.

Karta, w trybie 2D nie jest uciążliwa dla ucha. Trzy tryby pracy (dynamiczna zmiana zegarów / napięć zasilania, czy wyłączanie nieużywanych bloków) powodują, iż taka praca, nie tylko nam ale i karcie zdecydowanie bardziej służy.

Zmierzone temperatury wytwarzane przez kartę podczas pracy (full load 3D):

* GPU-Z 0.2.3 / wynik pomiaru obrotów (rpm) może nie zgadzać się z rzeczywistością

Temperatury nie należą może do najniższych, jednak przy tak potężnym, jednordzeniowym układzie (wydajność prawie 1TeraFlopa), muszą one znaleźć gdzieś swoje ujście. Nvidia już zapowiada wydanie w 4-tym kwartale układów GT200 w niższym procesie technologicznym. Pozwoli to zapewne nie tylko obniżyć temperaturę rdzenia, ale także zmniejszyć rozmiar układu oraz obniżyć cenę produkcji takiego krzemowego wafla. Póki co pozostaje nam borykać się z tym co mamy.

Testy wydajności: 3DMark 06 (DX 9c)

Według straszego 3dmark'a, który bardziej szereguje nam karty w środowisku DX9c (SM3.0), GTX 280 osiąga wydajność znacznie lepszą od najszybszej jednoprocesorowej karty 9800GTX, ale również nieco gorszą od 9800GX2 oraz HD3870X2. Ten test w odniesieniu do układu zbudowanego pod kątem lepszego wykorzystania kodu SM4.0, traci jednak powoli rację bytu, chociaż z drugiej strony daje nam odpowiedź co do teoretycznej wydajności w grach ukazujących się przed rokiem, czy dwoma.

Testy wydajności: 3DMark Vantage (DX10)

Testy 3dmark Vantage (Shader Model 4.0) odkrywają wreszcie pokłady możliwości jakimi dysponuje rdzeń GT200. Testowane profile High oraz Extreme ukazują ponad 1000 punktową przewagę nowej 280-tki nad dwuprocesorowym rozwiązaniem GeForce 9800GX2. Na przykładzie wyników z profilu Extreme, widać doskonale moc drzemiącą w tym kawałku krzemu. Wynik ponad dwukrotnie lepszy od 9800GTX, daje nadzieję na bezproblemową grę w najwyższych rozdzielczościach i uaktywnionych wszelkich dostępnych "wspomagaczach" obrazu. Przynajmniej w odniesieniu do chwili obecnej.

Testy wydajności: STALKER

Zapowiadane przez nvidię lepsze wykorzystanie 1GB bufora ramki w grach takich jak Stalker, przynosić ma wymierne korzyści. I tak też jest w rzeczywistości. Karta jest wydajniejsza od dwuprocesorowego Radeona HD3870X2, ale i nieco wolniejsza od 9800GX2. Tryb renderingu używany w tej grze (deffered rendering) nie sprzyja jednak sprzętowemu antyaliasingowi. Dzięki nowej konstrukcji nvidii sytuacja ta ma się niebawem zmienić. Zapowiadana nowa odsłona Stalkera: "Clear Sky" powinna poradzić sobie znakomicie z AA na kartach o pojemności pamięci 1GB (9800GX2/HD3870X2 posiadają już tylko pamięć wyłączną dla każdego rdzenia, czyli 2x512MB).

Testy wydajności: HALF LIFE2 Episode Two

Możliwości układu GT200 doskonale widoczne są na przykładzie, nie najmłodszego już przecież, silnika Source od Valve. Zaznacza się dość znaczna przewaga nad konstrukcjami dwuprocesorowymi w trybie wygładzania krawędzi, oraz niewielki spadek FPS po zwiększeniu rozdzielczości.

Testy wydajności: BioShock (DX10)

W Bioshocku sytuacja dosyć podobna jak w Stalkerze. Kilkanaście klatek słabiej od GX2 oraz około 10 więcej niż uzyskane na podkręconym 9800GTX. Kolejne sterowniki powinny jednak poprawić już i tak nie małą wydajność tego jednoprocesorowego potwora także w tej grze.

Testy wydjaności: Unreal Tournament 3

Ten sam silnik UT3Engine co w Bioshocku, tyle że w nieco innej konwencji rozgrywki. Unreal Tournament 3 na ustawieniach maksymalnych czerpie garściami z mocy CPU (obliczenia fizyki), stąd różnice pomiędzy kartami będą tu niewielkie. Na tyle duże jednak, aby móc stwierdzić która karta jest najwydajniejsza. GTX 280 nie pozostawia złudzeń.

Testy wydajności: Lost Planet (DX10)

Lost Planet jako test nieco kontrowersyjny (mocno zaznaczone optymalizacje nvidia), dobrze jednak nadaje się do porównań kart właśnie tego producenta. Uaktywnienie wygładzania krawędzi ukazuje wyraźną przewagę nowej konstrukcji. Napotykać można jednak mały problem ze sterownikami w trybie 8-krotnego antyaliasingu - znaczny spadek wydajności.

Testy wydajności: Enemy Territory: Quake Wars

Engine Doom 3 pomimo, że do najświeższych nie należy, doskonale sprawdza się w roli benchmarka środowiska OpenGL. Szkoda tylko, że nie najmłodszej odsłony (2.1), czyli zgodności z SM4.0. Widać jednak jak na dłoni, iż przy zwiększaniu obciążenia, karta GTX 280 traci relatywnie mniej (AA) aniżeli, do tej pory najmocniejszy dwuprocesorowy układ, 9800GX2.

Testy wydajności: World in Conflict (DX10)

World In Conflict to jak wiadomo gra silnie uzależniona od procesora centralnego. Nie ulega wątpliwości, że tu najbardziej przydałaby się optymalizacja wspomagania obliczeń fizyki przez GPU. Póki co, GT200 jest także tutaj rdzeniem najwydajniejszym, choć różnica 3 kl/s nikogo raczej nie przekona do wysupłania niemałej przecież kwoty na kartę pod kątem akurat tej gry.

Testy wydajności: Assassin's Creed

Assassin's Creed to kolejna gra zależna od wydajności CPU. Po uaktywnieniu wygładzania krawędzi GTX 280 minimalnie lepiej od "dwuprocesorówki" GX2. Niestety w rozdzielczości 1920x1200 nie można było uaktywnić multisamplingu, stąd testy AA odnoszą się do rozdzielczości nieco niższej. Generalnie zasada wydaje się prosta, im wyższa rozdzielczość i tryb AA, tym przewaga nowego GTX'a będzie rosnąć.

Testy wydajności: Need For Speed PRO STREET

W Need For Speed PRO STREET cała dotychczasowa przewaga GTX 280 nad 9800GX2 gdzieś nam uleciała. Nowa karta cechuje się tu niestety mniejszą wydajnością względem GX2, ale jednocześnie jest konstrukcją o około 10 fps szybszą od 9800GTX, czyli od jednoprocesorowej karty poprzedniej generacji.

Testy wydajności: CRYSIS (DX10)

Przede wszystkim warto zaznaczyć dobrą wydajność (bez rewelacji, ale solidnie) w środowisku DX9c.

Pod DX10, w rozdzielczości 1280x1024 uzyskuje ona nieco ponad 32 fps (średnio) - mierzone Frapsem, co jest wynikiem nieco gorszym od 9800GX2 (dwa rdzenie G92-450). Mając jednak na uwadze niedawną prezentację dema technologicznego FarCry 2 na karcie GTX 280, trudno nie oprzeć się wrażeniu, że jest to wina po części niedopracowanych sterowników, ale chyba przede wszystkim zupełnie innego sposobu obliczeń fizyki (GPU) w najnowszej odsłonie produktu Cryteka.

Podsumowanie

Nvidii nie można odmówić jednego. Potrafi doskonale wpasować się w aktualną sytuację rynkową z timingiem premier swoich nowych produktów. Z drugiej strony, niemal zawsze, w pierwszej kolejności są to układy z najwyższej półki, stąd popyt na nie do najwyższych należeć nie może. A jednak, jest to jeden ze sposobów na przekonanie do siebie także dużej rzeszy konsumentów wybierających kartę z niższego segmentu. Mając w swojej "stajni" najwydajniejszy i najbardziej złożony obecnie układ graficzny, NVIDIA pokazuje, że potrafi zaskakiwać, jeżeli nawet nie samą wydajnością pojedynczego rdzenia, to na pewno rozszerzoną funkcjonalnością GPU, który obecnie bez problemów może konkurować z jednostką centralną w wielu dziedzinach dedykowanych obliczeń.

Dużą korzyść może wreszcie przynieść realne wsparcie dla obliczeń fizyki PhysX, dzięki któremu w wielu nowoczesnych grach CPU przestanie być wąskim gardłem (efekt blokowania efektywnego renderingu scen 3D).

Na takie aplikacje przyjdzie nam jeszcze nieco poczekać. Już teraz jednak korzyści płynące z zastosowania niemal dwukrotnie większej liczby SP w stosunku do jednordzeniowych rozwiązań znanych z G80 czy G92, są bardzo widoczne. GTX 280 jest kartą o podobnej wydajności co "dwurdzeniowy" 9800GX2 w części dzisiejszych gier, przy rozdzielczościach rzędu 1680x1050. Przy większym obciążeniu AA/Aniso i rozdzielczościach HD jest już kartą wymiernie mocniejszą. Widać to doskonale po przyszłościowo pomyślanym teście 3dmark Vantage i profilach High, Extreme oraz wbudowanych weń feature testach.

dwie karty GeForce GTX 200 spięte w SLI

W podsumowaniu nie może zabraknąć także wzmianki o zapotrzebowaniu "prądowym" najmłodszych "dżiforsów". Dla GTX 260 minimalnym wymaganym zasilaczem będzie taki, który posiada łącznie 36A na linii 12V (500W); dla GTX 280 potrzeba już 40A (550W). Maksymalne TDP na poziomie 236W oraz 186W wskazują na ciągłą tendencję wzrostową w tym zakresie kolejnych generacji kart graficznych.

Wyjątek stanowi rodzina GeForce 9, która jak się okazało, była tylko odświeżonym face-liftem rdzenia G80 z kilkoma usprawnieniami i mniejszym zapotrzebowaniem na energię. GT200 to rdzeń, który pomimo dość dużej prądożerności, wyznacza ścieżkę na przyszłość rozwiązaniom coraz bardziej kompleksowym, odciążając docelowo już niemal zupełnie CPU od obliczeń związanych z tworzeniem scen 3D, w tym, a może przede wszystkim ze zmiennoprzecinkowymi obliczeniami realistycznej fizyki.

chłodzona wodą konstrukcja EVGA e-GeForce 9800GX2 Hydro Cooper 18

GTX 280 skierowany jest na chwilę obecną właściwie tylko do entuzjastów wydajności, a ukazanie się wersji chłodzonych wodą, wzorem 9800GX2, wydaje się już tylko kwestią czasu. Przy obecnym sposobie chłodzenia powietrzem, tak znacznie grzejącego się rdzenia, było by to rozwiązanie chyba najbardziej optymalne, zawężając przy tym jednak grono chętnych na inwestowanie w dodatkowy osprzęt potrzebny do zbudowania kompletnego systemu water-cooling'u. Moim skromnym zdaniem, przy wysokiej cenie tej karty, oraz względów całkowitych kosztów wydajnej platformy byłby to wybór bardzo racjonalny.

Na koniec nieco o zapowiadanych cenach kart GeForce GTX 260 / GTX 280.

Końcowa cena najmocniejszego obecnie GTX 280, kształtować ma się na poziomie 649 dolarów, co jak na absolutny rynkowy TOP wydaje się dla większości ceną stosunkowo wysoką. Dużo lepiej wyglądać będzie koszt zakupu GTX 260. Karta początkowo ma pojawić się w cenie 399 dolarów, a po premierze nowej rodziny ATI Radeon z serii HD4800 (329$ za HD4870) może spaść nawet do 349$. Pozostaje nam tylko czekać na większą dostępność tych kart i sensowne ceny w naszym kraju. Wg zapowiedzi ich początkowa dostępność będzie bardzo ograniczona.

Platforma testowa

AMD Phenom 8650 - Triple-Core, 2300MHz @ 2900MHz
więcej informacji na temat procesora
MSI K9A2 Platinum rev1 (AMD 790FX) CrossFireX sAM2+ (bios v1.33beta)
Coolermaster Hyper TX2 sAM2
Kingston HyperX DDR2-1066 2x1GB CL 5-5-5-18 CMD 2T unganged mode
Seagate 250GB 7200.10 ST3250410AS 16MBcache NCQ
Chieftec CH-03-PA
Chieftec CFT-620-A12S

Sterowniki, system operacyjny i narzędzia:

Windows XP Professional SP3 PL
Windows VISTA Home Premium SP1 PL
DirectX March'08 update
amd: AMD X2 driver 1.3.2.0.53 - WinXP
nvidia: ForceWare 169.32 whql / CRYSIS XP - GeForce 8800GS
nvidia: ForceWare 169.44 beta / ETQW - GeForce 8600
nvidia: ForceWare 174.74 beta - GeForce 8 series - WinXP
nvidia: ForceWare 174.74 whql - GeForce 9 series - WinXP
nvidia: ForceWare 175.12 beta - GeForce 8/9 series - Vista
nvidia: ForceWare 175.16 whql / Assassin's Creed, HL2E2 - GeForce 9 series - Vista
nvidia: ForceWare 175.16 whql - 9600GT - Vista/XP
nvidia: ForceWare 177.26 beta - GTX 280 - Vista/XP
ati: Catalyst 8.4 - WinXP
ati: Catalyst (8.471.1) Vantage Hotfix - Vista
ati: Catalyst 8.5 / Assassin's Creed, HL2E2 - HD3870 G4, HD3870X2 - Vista
GPU-Z 0.2.3
FRAPS 2.9.4
RivaTuner 2.09
Fur Stability Benchmark
ATiTool 0.27b4