WAŻNE
TERAZ

Wójt, działki i zmiana planów. Kto o nich wiedział, ten nieźle zarobi

Premiera nowej grafiki nVidii GT200. Testujemy GeForce GTX 280

Nowa oferta NVIDII skierowana jest do osób nie uznających żadnych kompromisów, oraz do tych, dla których wysupłanie pokaźnej sumy, za najmocniejszy w danej chwili układ graficzny, nie stanowi żadnego problemu. 1,4 miliarda tranzystorów, 240 rdzeni procesorowych SP, 32 jednostki renderujące ROP, wydajność zmiennoprzecinkowa 933 GigaFlopów/s, 512-bitowy kontroler pamięci z przepustowością 138 GB/s. Do tego PureVideo HD drugiej generacji, oraz technologia zaawansowanego zarządzania energią o nazwie HybridPower.

GeForce GTX 280

Image

Od ostatniej premiery najwydajniejszej obecnie karty graficznej na rynku - GeForce 9800GX2 - mijają właśnie 3 miesiące, a NVIDIA sypie jak z rękawa kolejnymi konstrukcjami skierowanymi w ten segment.

Jak ogólnie wiadomo, premiera kart opartych o nowy chipset GT200 została nieco przyspieszona. Powodem takiego stanu rzeczy stała się zapowiedź wprowadzenia już za nieco około tydzień, nowej rodziny kart konkurującego obozu ATi/AMD, opartych o rdzeń kolejnej generacji - RV770.

Według wczesnych zapowiedzi, kolejne jednoprocesorowe karty ATi raczej nie zagrożą pozycji lidera, skierowane są bowiem do bezpośredniej "walki" z segmentami nieco niższymi, w których znajdują się karty oparte o bardzo udany, ale już nieco leciwy rdzeń G92 - występujący między innymi na GeForce 8800GTS 512MB oraz 9800GTX. Co to oznacza dla nas, nie trzeba chyba nikomu szczególnie tłumaczyć. Spadek cen starszej generacji układów GeForce z półek high-mid, oraz mainstram-high staje się coraz bardziej realny.

Jeżeli chodzi o nowości od NVIDII, póki co będziemy mieć dostęp do najpotężniejszych układów jednoprocesorowych, ale tym samym najdroższych rozwiązań na rynku.

Przy okazji premiery NVIDIA kolejny raz zmieniła system oznaczeń swoich produktów. Tym razem zrezygnowano z dodatkowych sygnaturek GS, GT czy GTX umieszczanych na końcu numeracji rodziny karty, na rzecz systemu liczbowego, znanego już z marketingowych oznaczeń ATI Radeon. Nową rodzinę otwierają właśnie tak oznaczone produkty, a więc GeForce GTX 260 oraz GTX 280. Jak nie trudno się domyśleć, ten pierwszy jest układem nieco słabszym, chociaż jego wydajność może oscylować nieco powyżej mającego się dopiero ukazać Radeona HD4870. Ten drugi będzie prawdziwym topem, zarówno jeżeli chodzi o parametry jak i prezentowany "performance".

Nowa oferta NVIDII skierowana jest więc do osób nie uznających żadnych kompromisów, oraz do tych, dla których wysupłanie pokaźnej sumy, za najmocniejszy w danej chwili układ graficzny, nie stanowi żadnego problemu.

Architektura GT200 w pigułce

Image

Układ GT200 pod względem architektury i wykorzystania Stream Procesorów należy do drugiej generacji Unified Shader (zunifikowanych shaderów). W dalszym ciągu karta wspiera jednak komunikację z aplikacjami poprzez standardy API DirectX10 oraz OpenGL 2.1. Wydawało by się, że dzięki temu nie uświadczymy żadnej większej rewolucji, jednak wprowadzone usprawnienia w potokach wykonawczych mają wg producenta znacznie przyspieszyć przetwarzanie kodu zgodnego z Shader Model 4.0, a tym samym na bardziej efektywne wykorzystanie środowiska DirectX10.

nagi GT200, czyli zdjęcia rdzenia pod mikroskopem elektronowym�

Image

Rdzeń GT200 składa się z około 1,4 miliarda tranzystorów, czyli prawie dwukrotnie więcej aniżeli miało to miejsce w układach serii G92, oraz ponad dwukrotnie więcej od G80. Zwiększenie liczby tranzystorów budujących układ nie bierze się z niczego. Ilość miejsca potrzebna do "wciśnięcia" 240-tu SPu,  większej ilości pamięci podręcznej, szerszego kontrolera pamięci (512-bit) oraz większej ilości jednostek ROP i TF musi znaleźć ujście. Warto jednak zauważyć iż sam rdzeń, produkowany przez fabrykę TSMC w wymiarze technologicznym 65nm zajmuje przy tym "zaledwie" 576mm2. Jest zatem większy od poprzedniego "potwora" G80 o tylko i aż 95mm2.

TPC

Zarówno pierwsza generacja zunifikowanej architektury o strukturze Scalable Processor Array (SPA) jak i jej rozszerzenie w GT200, zbudowane zostały w oparciu o klastry (bloki wykonawcze). Dzięki dodatkowym optymalizacjom w GT200, bloki te mogą pracować jako TPC czyli "Texture Processing Clusters" w trybie przetwarzania grafiki (Graphics processing mode) lub TPC "Thread Processing Clusters" w trybie przetwarzania równoległego (Parallel compute mode).

Każdy klaster TPC zawiera pewną liczbę tzw. "streaming multiprocessors" (SM), w których znajduje się po 8 "rdzeni procesorowych" SP (dawniej wg nomenklatury stream procesorów). I tu dochodzimy do sedna.  Podstawową różnicą jaką dzieli obydwie rodziny kart GeForce będzie, nie tyle liczba klastrów TPC ( 10 w stosunku do 8 ), co przede wszystkim liczba bloków multiprocesorowych (SM) przypadających na pojedynczy klaster. W GeForce 8 i 9 mieliśmy 2 takie bloki, w GeForce GTX 260/280 są już po 3. Z prostego rachunku wychodzi nam zatem: 10 TPC * 3 bloki SM * 8 pojedynczych rdzeni SP, co daje całkowitą sumę w ilości 240 jednostek przetwarzających SP.

Ponadto w każdym klastrze TPC znajduje się po 8 jednostek filtrujących tekstury, a więc całościowo równa się to liczbie 80-u TF/TA. Cały klaster do ROPów (render operation processors) "przyłączony" jest przy pomocy pamięci podręcznej drugiego poziomu (Tex L2 cache). Ale tylko w przypadku korzystania z TPC jako "Texture Processing Units", czyli operacji na grafice. Drugi przypadek (wykorzystanie skalowalności architektury) to TPC jako "Thread Processing", czyli przetwarzanie równoległe (wielowątkowość) znane doskonale z procesorów CPU. To także duża zmiana jeżeli chodzi o elastyczność nowego rdzenia.

Image

- Parrallel Computing Architecture

Przetwarzanie równoległe, przy wykorzystaniu TPC w roli "Thread Processing Clusters" (klastrów wątków) jest obecnie o wiele łatwiejsze i efektywniejsze niż miało to miejsce do tej pory. W każdym z bloków multiprocesorowych (SM) do komunikacji i wymiany danych pomiędzy pojedynczymi "rdzeniami procesorowymi" wykorzystywana jest szybka pamięć dzielona tzw. "Local Memory", bez niepotrzebnego angażowania do zapisu, lub odczytu podsystemu pamięci zewnętrznej. Charakter tej otwartej architektury, predyscynuje do wykorzystania możliwości jakie do tej pory zarezerwowane były tylko dla procesorów centralnych. I tu z pomocą przychodzi środowisko NVIDIA CUDA (Compute Unified Device Architecture), dzięki któremu nieużywane do generowania grafiki rdzenie procesorowe SP, zostaną zaangażowane do pracy przy bardziej pożytecznych np. dla nauki obliczeniach.

Architektura SIMT

Operacje graficzne oraz obliczenia wielowątkowe używają dwóch różnych modeli przetwarzania. Do wykonywania poleceń w strukturze klastra TPC używana jest architektura instrukcji MIMD (multiple instruction, multiple data); do wykonywania poleceń w obrębie samych bloków SM używana jest architektura SIMT (single instruction, multiple thread). W odróżnieniu od architektury SIMD (single instruction, multiple data), skalarny SIMT nie potrzebuje jednak do obliczeń pobierać parametrów szerokości wektora, stąd operacje mogą teraz przebiegać znacznie szybciej (pomijanie tej wartości w przebiegu). Dzięki architekturze SIMT jednostki SP w układzie przetwarzania wątków mogą być przez cały czas w pełni wykorzystywane. Zapewnia to także łatwiejszą programowalność i bardziej efektywne wykorzystanie stream procesorów do wymaganych obliczeń.

Dzięki znacznym usprawnieniom w architekturze bloków SM, 20% wydajniejszym"schedulerze" rozkazów oraz multiwątkowemu zestawowi instrukcji SIMT, układ potrafi w locie przetworzyć ponad 30.000 wątków, co w porównaniu z nieco ponad 12.000 możliwymi do wykonania jednoczesnymi wątkami przez układ G80 (8800GTX) wydaje się ogromnym usprawnieniem.

Larger Register File

Przestrzeń przeznaczona dla przetrzymywania pliku rejestru w bloku SM, została również podwojona względem serii GeForce 8 i 9. W starszej serii układów, zbyt długi program shaderowy powodował konieczność przenoszenia części danych do pamięci (plik wymiany). W GT200 wykorzystanie znacznie dłuższych i bardziej złożonych programów shaderowych jest nie tylko możliwe, ale i zdecydowanie bardziej efektywne.

Double Precision

Jedną z najważniejszych zmian w nowej architekturze układu GT200, jest podwojona, 64-bitowa precyzja obliczeń zmiennoprzecinkowych (double precision). Dzięki takiemu rozwiązaniu na GPU będzie można bez przeszkód dokonywać złożonych obliczeń, które wymagają wysokiej precyzji i dokładności pomiarów, np. aplikacje naukowe, inżynierskie, czy finansowe. Dla przykładu wydajność pojedynczego rdzenia GT200 jest porównywalna, mniej więcej z dwoma czterordzeniowymi procesorami Xeon. 64-bitowa precyzja floating-point GT200 jest także zgodna z normą IEEE 754R.

Usprawnienia dotknęły ponadto nie tylko samych bloków wykonawczych, ale również wszystkich pozostałych elementów logiki układu:

  • usprawniono Dual Issue w SFU (Special Funktion Units) - specjalne funkcje matematyczne (zmiennoprzecinkowe) realizowane przez jednostki SM przy pomocy instrukcji MUL, MADD, oraz ADD
  • podniesiono wydajność jednostek TF w zakresie filtrowania tekstur w trybach bilinearnym oraz anizotropowym. Zmierzona poprawa prędkości filtrowania, przypadająca na jeden cykl zegara, względem układu G92 wynosi około 22%.
  • usprawniono pracę jednostek ROP, które zdolne są obecnie do przetwarzania i mieszania 32 pikseli na zegar. W starszej generacji możliwości te ograniczone były do przetworzenia 24 oraz mieszania (blending) 12 pikseli w jednym cyklu. Nowe rozwiązanie posiada zatem wymierny wpływ na wydajność antyaliasingu w połączeniu z oświetleniem HDR.
  • usprawniono prędkość przetwarzania geometry shadera oraz komunikacji z buforem Stream Out
  • podniesiono wydajność w zakresie kompresji bufora głębokości, w tym także funkcji Z-cull
  • zastosowano bardziej efektywny sposób komunikacji z systemem (usprawnienie komunikacji na drodze hardware - sterownik)

Spojrzenie na konstrukcje referencyjne

Tym razem nvidia dla obydwu kart zastosowała ten sam moduł chłodzenia. Różnice z zewnątrz ograniczają się jedynie do kolorystyki (jeżeli o takowej można w ogóle mówić).  GTX w wersji 280  wydaje się bardziej "czarny" i właściwie jest to cała różnica na jaką się natkniemy. Niestety, póki co nie było możliwości rozkręcenia obydwu modeli i porównania zestawu chłodzenia występującego na referencyjnych konstrukcjach. Wydaje się jednak, że istotnych różnic raczej i tu nie uświadczymy.

NVIDIA GeForce GTX 260

NVIDIA GeForce GTX 260

- nvidia GeForce GTX 280

nvidia GeForce GTX 280

Długość całej karty (zabudowy) jest niemal identyczna jak w przypadku 9800GX2. Referencyjny system chłodzenia stosowany w kartach opartych o GT200, przez zewnętrznych producentów nie będzie zapewne poddawany żadnym modyfikacjom, stąd w sprzedaży powinny pojawić się mniej "trumiennie" wyglądające modele, które odróżnić będzie można jedynie po kolorowych naklejkach właściwych dla danego producenta.

Jeżeli chodzi o sam wentylator, którym uraczyła nas nvidia, jest to po prostu kolejna wariacja w temacie GeForce z górnej półki, przez co do najcichszych nie należy. Trzeba jednak przyznać, że do schłodzenia tego "potwora" potrzeba znaczącego przepływu powietrza. Więcej na ten temat w dalszej części artykułu.

GTX 200 series (tył obydwu kart)

nvidia GeForce GTX 280

Karta oglądana z tyłu prezentuje się bliźniaczo podobnie do GeForce 9800GX2, mamy więc tu ponownie kompletną zabudowę płytki drukowanej (tzw. "puszkę") wyposażoną w poprzeczne nacięcia ułatwiające odprowadzanie gromadzonego ciepła z górnej części PCB.

wyjścia w serii GT200

po lewej GeForce 9800 GTX, po prawej GeForce GTX 280

nvidia GeForce GTX 280

Standardowy komplet wyjść. Dwa złącza DVI-I z obsługą HDCP oraz wyjście HDTV-out (S-video). HDMI jest również dostępne, jednak potrzebna będzie specjalna przejściówka. Wersje produkcyjne niektórych kart powinny już zostać wyposażone w złącze HDMI wbudowane pod śledzia. Co bardzo istotne karty obsługują najnowszy dostępny tryb przesyłania obrazu poprzez interfejs DisplayPort, z tą jednak różnicą (w kontekście porównania ze starszą serią GeForce 8 i 9), że tym razem będzie można przesłać obraz w rozdzielczości ponad 2560x1600 i 10-bitowym kolorze (do miliarda barw na jednym ekranie). Poprzednie generacje kart również wewnętrznie operowały na 10-bitach, jednak na wyjściu musiały być już zgodne z formatem (RGB) czyli 8-bitami na kanał.

Nowa rodzina kart: GTX 260 / GTX 280

Nową rodzinę najwydajniejszych kart nvidii otwierają dwa GTX'y numerowane jako 260 oraz 280. Obydwie karty zbudowano wokół tego samego układu, jakim jest GT200.

GTX 280 jako prawdziwy top dla entuzjastów wydajności, posiada pełen, nienaruszony cięciami w architekturze rdzeń GT200. Zawiera on zatem 240 rdzeni procesorowych SP, 32 jednostki renderujące ROP oraz 80 jednostek filtrujących tekstury (TF).

Dzięki większej ilości jednostek ROP/TF karta dysponuje także wyższym od starszych GTX'ow współczynnikiem wypełniania, który wynosi tu 48160 MegaTekseli/s. Zegar taktujący domenę ROP został  ustalony na dosyć bezpiecznym poziomie i wynosi 602MHz. Biorąc jednak pod uwagę złożoność rdzenia GT200, jej taktowanie wydaje się w zupełności wystarczające.

Dużo większy wpływ na wydajność w dzisiejszych grach będą mieć zegary procesorów strumieniowych. Różnica w taktach pomiędzy domeną shader a ROP wynosi 2.16, co daje 1296MHz na Stream Procesorach i przy 240 SPu oferują one maksymalną wydajność zmiennoprzecinkową na poziomie 933 GigaFlopów. Jak na pojedynczy rdzeń, zbliżenie się do wydajności 1TeraFlopa jest ogromnym krokiem naprzód.

Wbudowany kontroler pamięci posiada szerokość 512-bit i przy zegarze 1107 MHz dla pamięci GDDR3 posiada górną przepustowość na poziomie aż 138 GB/s. Niepokojącym, na pierwszy rzut oka, parametrem na który warto zwrócić uwagę jest wartość TDP (Thermal Design Power), wynoszący aż 236W dla tej topowej konstrukcji. Do tego wątku postaram się jeszcze powrócić w dalszej części artykułu przy omawianiu temperatury pracy tej karty.

 
GeForce
8800GTX
GeForce
9800GTX
GeForce
9800 GX2
GeForce
GTX 280
nazwa rdzenia
G80-300
G92-420
2x G92-450
GT200
technologia
90nm
65nm
65nm
65nm
licz. tranzys.
powierz. rdzenia
681 mln
484 mm2
754 mln
324 mm2
754 mln
324 mm2
1.400 mln
576 mm2
maksymalne TDP
177 W
160W
210W
236W
jednostki ROP
jedn.  adresuj. TA
jedn. Teksturujące
24
32
TF 64
16
64
64
2 x16
2x 64
2x 64
32
80
80
jednostki SP
128
128
2x 128
240
zegar GPU
575 MHz
675 MHz
600 MHz
602 MHz
wydajność wypełniania
36 800 MT/s
43 200 MT/s
76 800 MT/s
48 160 MT/s
częstotliwość shaderów
1357 MHz
1688 MHz
1500 MHz
1296 MHz
wydajność zmienn.  
521 GFlops
648 GFlops
1152 GFlops
933 GFlops
zegar pamięci
DDR 900 MHz
ef. 1800 MHz
DDR 1100 MHz
ef. 2200 MHz
DDR 1000 MHz
ef. 2000 MHz
DDR 1107 MHz
ef. 2214 MHz
przepustowość pamięci
~84 GB/s
69 GB/s
2x 63 GB/s
138 GB/s
ilość i typ pamięci
768 MB
GDDR 384-bit
512 MB
GDDR 256-bit
2x 512 MB
GDDR 256-bit
1024 MB
GDDR3 512-bit
magistrala     
PCI-E 16x 1.0/1.1
PCI-E 16x 2.0
PCI-E 16x 2.0
PCI-E 16x 2.0
chłodzenie
dwuslotowe
dwuslotowe
dwuslotowe
dwuslotowe
sprzętowe HD
tak
PureVideo HD
VP1
tak
PureVideo HD
VP2
tak
PureVideo HD
VP1
tak  (PureVideo HD 2nd gen)
VP3
multi-GPU
SLI
Tri-SLI
SLI
Tri-SLI
dodatkowe zasilanie
2x 6pin
2x 6pin
1x 6pin
1x 8pin
1x 6pin
1x 8pin

Nieco słabszy GTX 260, bazuje na zablokowanym częściowo układzie GT200. Praktyka zatem identyczna jak w przypadku ostatniej serii kart opartych o układy G92, a także G80. W przypadku GTX 260 aktywnych pozostało 192 rdzeni procesorowych, 28 ROP'ów oraz 64 jednostki filtrujące, przy jednoczesnym "okrojeniu" szyny pamięci do 448-bit.

Całość najbardziej przywołuje analogię do podobnych cięć znanych właśnie z G80, gdzie oprócz ingerencji "chirurgicznej" w jednostki wykonawcze, zablokowano część szyny pamięci oraz jej maksymalną obsługiwaną ilość. Tu jest podobnie, GTX 260 posiada już "tylko" 896MB pamięci GDDR3.

Dzięki mniejszej ilości TF oraz ROP współczynnik wypełniania spadł, w stosunku do GTX 280, do poziomu 36864 Megatekseli/s. Pomimo tego, jest to wartość znacznie przewyższająca starego 8800 GTS'a 640MB oraz nieco młodsze 8800GT, i jak widzimy niemal identyczna co przy leciwym już 8800GTX'ie. TDP dla tej karty ustalono na poziomie 186W, co jest wartością w stosunku do "silniejszego" brata o 50W niższą. Różnica na pewno niebagatelna.

 
GeForce
8800 GTS 640
GeForce
8800 GT 512
GeForce
GTX 260
nazwa rdzenia
G80-100
G92-270
GT200
technologia
90nm
65nm
65nm
licz. tranzys.
powierz. rdzenia
681 mln
484 mm2
754 mln
324 mm2
1.400 mln
576 mm2
maksymalne TDP
147W
110W
186W
jednostki ROP
jedn.  adresuj. TA
jedn. Teksturujące
20
24
TF48
16
56
56
28
64
64
jednostki SP
96
112
192
zegar GPU
500 MHz
600 MHz
576 MHz
wydajność wypełniania
24 000 MT/s
33 600 MT/s
36 860 MT/s
częstotliwość shaderów
1180 MHz
1500 MHz
1242 MHz
wydajność zmienn.  
340 GFlops
506 GFlops
715 GFlops
zegar pamięci
DDR 800 MHz
(ef. 1600 MHz)
DDR 900 MHz
(ef. 1800 MHz)
DDR 1000 MHz
ef. 2000 MHz
przepustowość pamięci
62 GB/s
56 GB/s
109 GB/s
ilość i typ pamięci
640 MB
GDDR 320-bit
512 MB
GDDR3 256-bit
1024 MB
GDDR3 512-bit
magistrala     
PCI-E 16x 1.1
PCI-E 16x 2.0
PCI-E 16x 2.0
chłodzenie
dwuslotowe
jednoslotowe
dwuslotowe
sprzętowe HD
tak
PureVideo HD
VP1
tak
PureVideo HD
VP2
tak  (PureVideo HD 2nd gen)
VP3
multi-GPU
SLI
SLI
Tri-SLI
dodatkowe zasilanie
1x 6-pin
1x 6-pin
1x 6pin
1x 8pin

Obydwie konstrukcje obsługują technikę łączenia ze sobą maksymalnie trzech kart (dwa złącza Scalable Link Interconnect) oraz potrafią skorzystać z dobrodziejstw zaawansowanego zarządzania energią o nazwie HybridPower. W przypadku tak prądożernych konstrukcji, dla naszego portfela, może się to okazać zbawienne.

ZASILANIE

po prawej gniazdka zasilania na karcie GeForce GTX 280, po lewej geForce 9800 GTX

Image

Jeżeli chodzi o zasilanie, oprócz energii dostarczanej przez złącze krawędziowe z portu PCI-E 2.0, karty potrzebują "dokarmienia" dwiema dodatkowymi wtyczkami 6-pin PEG (w przypadku GTX 260), oraz 6-pin / 8-pin PEG w przypadku GTX 280. Jeżeli nasz zasilacz nie posiada "natywnej" wtyczki 8-pin, nic straconego, stosowne przejściówki znajdują się w zestawie z kartą.

"Przebudowane" zostało także PureVideo HD drugiej generacji. Jednoczesna obsługa dwóch źródeł wideo wysokiej rozdzielczości, oraz pełne wsparcie dla formatów H.264 i VC-1, oferują nieco bardziej rozszerzoną funkcjonalność w stosunku do możliwości układu G94-300 (9600GT).

    PureVideo HD 2nd gen /VP3:
  • Hardware decode acceleration for H.264, VC-1 and MPEG2
  • Image post processing
  • Dynamic contrast enhacement
  • Blue, green and skin tone enhacements
  • HD dual-stream decode
  • Windows Vista Aero with Blue-ray movie playback
  • Full score for HQV and HQV HD

Temperatura pracy GTX 280

Do testów dotarła obecnie tylko jedna karta - referencyjny GeForce GTX 280. Na wstępie warto wspomnieć o nieco przerażającym parametrze TDP (Thermal Design Power), którym została ona obarczona przez producenta. Wynoszący aż 236W TDP jest podawany dla warunków laboratoryjnych, stąd realna wartość poboru energii podczas najbardziej wymagających obecnie gier powinna okazać się nieco niższa.

Jako że mamy do czynienia z wersją przedprodukcyjną nie będę się w tym teraz zanadto zagłębiać. Przy okazji testów wersji sklepowych do tego tematu będzie trzeba powrócić, ponieważ jest to jedna z najważniejszych dla użytkowników kwestii i takie pomiary wykonać po prostu trzeba.

Póki co możemy posiłkować się danymi podawanymi przez nvidię, z których jasno wynika iż poczynione usprawnienia w zarządzaniu energią (wyłączanie nieużywanych bloków GPU) powodują, że podczas pracy w środowisku 2D, czy też odtwarzania wideo realny pobór energii przez kartę jest wręcz niewiarygodnie niski. Dodatkowo, w przypadku korzystania z płyt obsługujących technologię HybridPower (seria chipsetów nForce 780a/790i) istnieje możliwość całkowitej "prądowej" deaktywacji karty, a tym samym jej wyłączenie na czas wyświetlania scen 2D.

Wg producenta karty GTX 260 / 280 obsługują 4 tryby dynamicznego zarządzania energią:

  • Idle / 2D Power mode - Tryb 2D /tzw spoczynek ~25W
  • Blue Ray / DVD Playback  mode - Tryb odtwarzania materiału video ~35W
  • full 3D performance mode - Tryb 3D /tzw pełne obciążenie < 236W (TDP)
  • HybidPower mode - 0W

Czy rzeczywiście jest możliwe, aby NVIDII udało się tak efektywnie wyłączać poszczególne bloki/klastry w GPU, ograniczając przy tym tak drastycznie pobór energii przez całą kartę?

Wydaje się to, mimo wszystko, mało prawdopodobne i kolejnym razem trzeba będzie sprawdzić również i te rewelacje.

Wracając do naszego głównego bohatera, czyli GeForce GTX 280, trudno było przy tej wydajności spodziewać się urządzenia nadzwyczaj cichego, czy chłodnego i tak też jest w rzeczywistości. Karta nagrzewa się dość znacznie w stosunkowo krótkim czasie, przez co referencyjny wicherek ma wciąż "pełne ręce roboty". Domyślnie, minimalne jego obroty ustalone zostały na poziomie 40% (1000RPM) i dalej dzięki autokontroli wędrują do końca skali, czyli 100% (1600RPM).

jak osiągnąć temperaturę wrzenia w minutę - 40% prędkości obrotowej wentylatora w akcji

Image
Image

Podczas próby wymuszenia pracy przy 40% prędkości obrotowej wiatraka, karta bardzo szybko się przegrzewała (temp threshold "wartość progowa temperatury" dla GT200 wynosi 105°C). Temperatura wzrastała niemal liniowo, stąd trzeba było przywrócić kontrolę automatyczną. Wniosek - cicho niestety nie będzie. Już 50% prędkości powoduje dosyć nieprzyjemny szum, który podczas stopniowego nagrzewania narasta. Podczas intensywnej gry wentylator pracuje na 100% swoich możliwości, a wydobywający się szum bardzo przypomina "suszarkę" montowaną w  Radeonach 2900XT.

Karta, w trybie 2D nie jest uciążliwa dla ucha. Trzy tryby pracy (dynamiczna zmiana zegarów / napięć zasilania, czy wyłączanie nieużywanych bloków) powodują, iż taka praca, nie tylko nam ale i karcie zdecydowanie bardziej służy.

Image

Zmierzone temperatury wytwarzane przez kartę podczas pracy (full load 3D):

Image

* GPU-Z 0.2.3 / wynik pomiaru obrotów (rpm) może nie zgadzać się z rzeczywistością

Temperatury nie należą może do najniższych, jednak przy tak potężnym, jednordzeniowym układzie (wydajność prawie 1TeraFlopa), muszą one znaleźć gdzieś swoje ujście. Nvidia już zapowiada wydanie w 4-tym kwartale układów GT200 w niższym procesie technologicznym. Pozwoli to zapewne nie tylko obniżyć temperaturę rdzenia, ale także zmniejszyć rozmiar układu oraz obniżyć cenę produkcji takiego krzemowego wafla. Póki co pozostaje nam borykać się z tym co mamy.

Testy wydajności: 3DMark 06 (DX 9c)

Według straszego 3dmark'a, który bardziej szereguje nam karty w środowisku DX9c (SM3.0), GTX 280 osiąga wydajność znacznie lepszą od najszybszej jednoprocesorowej karty 9800GTX, ale również nieco gorszą od 9800GX2 oraz HD3870X2. Ten test w odniesieniu do układu zbudowanego pod kątem lepszego wykorzystania kodu SM4.0, traci jednak powoli rację bytu, chociaż z drugiej strony daje nam odpowiedź co do teoretycznej wydajności w grach ukazujących się przed rokiem, czy dwoma.

Testy wydajności GeForce GTX 280
Testy wydajności GeForce GTX 280

Testy wydajności: 3DMark Vantage (DX10)

Testy 3dmark Vantage (Shader Model 4.0) odkrywają wreszcie pokłady możliwości jakimi dysponuje rdzeń GT200. Testowane profile High oraz Extreme ukazują ponad 1000 punktową przewagę nowej 280-tki nad dwuprocesorowym rozwiązaniem GeForce 9800GX2. Na przykładzie wyników z profilu Extreme, widać doskonale moc drzemiącą w tym kawałku krzemu. Wynik ponad dwukrotnie lepszy od 9800GTX, daje nadzieję na bezproblemową grę w najwyższych rozdzielczościach i uaktywnionych wszelkich dostępnych "wspomagaczach" obrazu. Przynajmniej w odniesieniu do chwili obecnej.

Testy wydajności GeForce GTX 280
Testy wydajności GeForce GTX 280

Testy wydajności: STALKER

Zapowiadane przez nvidię lepsze wykorzystanie 1GB bufora ramki w grach takich jak Stalker, przynosić ma wymierne korzyści. I tak też jest w rzeczywistości. Karta jest wydajniejsza od dwuprocesorowego Radeona HD3870X2, ale i nieco wolniejsza od 9800GX2. Tryb renderingu używany w tej grze (deffered rendering) nie sprzyja jednak sprzętowemu antyaliasingowi. Dzięki nowej konstrukcji nvidii sytuacja ta ma się niebawem zmienić. Zapowiadana nowa odsłona Stalkera: "Clear Sky" powinna poradzić sobie znakomicie z AA na kartach o pojemności pamięci 1GB (9800GX2/HD3870X2 posiadają już tylko pamięć wyłączną dla każdego rdzenia, czyli 2x512MB).

Testy wydajności GeForce GTX 280
Testy wydajności GeForce GTX 280

Testy wydajności: HALF LIFE2 Episode Two

Możliwości układu GT200 doskonale widoczne są na przykładzie, nie najmłodszego już przecież, silnika Source od Valve. Zaznacza się dość znaczna przewaga nad konstrukcjami dwuprocesorowymi w trybie wygładzania krawędzi, oraz niewielki spadek FPS po zwiększeniu rozdzielczości.

Testy wydajności GeForce GTX 280
Testy wydajności GeForce GTX 280

Testy wydajności: BioShock (DX10)

W Bioshocku sytuacja dosyć podobna jak w Stalkerze. Kilkanaście klatek słabiej od GX2 oraz około 10 więcej niż uzyskane na podkręconym 9800GTX. Kolejne sterowniki powinny jednak poprawić już i tak nie małą wydajność tego jednoprocesorowego potwora także w tej grze.

Testy wydajności GeForce GTX 280

Testy wydjaności: Unreal Tournament 3

Ten sam silnik UT3Engine co w Bioshocku, tyle że w nieco innej konwencji rozgrywki. Unreal Tournament 3 na ustawieniach maksymalnych czerpie garściami z mocy CPU (obliczenia fizyki), stąd różnice pomiędzy kartami będą tu niewielkie. Na tyle duże jednak, aby móc stwierdzić która karta jest najwydajniejsza. GTX 280 nie pozostawia złudzeń.

Testy wydajności GeForce GTX 280

Testy wydajności: Lost Planet (DX10)

Lost Planet jako test nieco kontrowersyjny (mocno zaznaczone optymalizacje nvidia), dobrze jednak nadaje się do porównań kart właśnie tego producenta. Uaktywnienie wygładzania krawędzi ukazuje wyraźną przewagę nowej konstrukcji. Napotykać można jednak mały problem ze sterownikami w trybie 8-krotnego antyaliasingu - znaczny spadek wydajności.

Testy wydajności GeForce GTX 280
Testy wydajności GeForce GTX 280

Testy wydajności: Enemy Territory: Quake Wars

Engine Doom 3 pomimo, że do najświeższych nie należy, doskonale sprawdza się w roli benchmarka środowiska OpenGL. Szkoda tylko, że nie najmłodszej odsłony (2.1), czyli zgodności z SM4.0. Widać jednak jak na dłoni, iż przy zwiększaniu obciążenia, karta GTX 280 traci relatywnie mniej (AA) aniżeli, do tej pory najmocniejszy dwuprocesorowy układ, 9800GX2.

Testy wydajności GeForce GTX 280
Testy wydajności GeForce GTX 280

Testy wydajności: World in Conflict (DX10)

World In Conflict to jak wiadomo gra silnie uzależniona od procesora centralnego. Nie ulega wątpliwości, że tu najbardziej przydałaby się optymalizacja wspomagania obliczeń fizyki przez GPU. Póki co, GT200 jest także tutaj rdzeniem najwydajniejszym, choć różnica 3 kl/s nikogo raczej nie przekona do wysupłania niemałej przecież kwoty na kartę pod kątem akurat tej gry.

Testy wydajności GeForce GTX 280

Testy wydajności: Assassin's Creed

Assassin's Creed to kolejna gra zależna od wydajności CPU. Po uaktywnieniu wygładzania krawędzi GTX 280 minimalnie lepiej od "dwuprocesorówki" GX2. Niestety w rozdzielczości 1920x1200 nie można było uaktywnić multisamplingu, stąd testy AA odnoszą się do rozdzielczości nieco niższej. Generalnie zasada wydaje się prosta, im wyższa rozdzielczość i tryb AA, tym przewaga nowego GTX'a będzie rosnąć.

Testy wydajności GeForce GTX 280
Testy wydajności GeForce GTX 280
Testy wydajności GeForce GTX 280

Testy wydajności: Need For Speed PRO STREET

W Need For Speed PRO STREET cała dotychczasowa przewaga GTX 280 nad 9800GX2 gdzieś nam uleciała. Nowa karta cechuje się tu niestety mniejszą wydajnością względem GX2, ale jednocześnie jest konstrukcją o około 10 fps szybszą od 9800GTX, czyli od jednoprocesorowej karty poprzedniej generacji.

Testy wydajności GeForce GTX 280
Testy wydajności GeForce GTX 280

Testy wydajności: CRYSIS (DX10)

Przede wszystkim warto zaznaczyć dobrą wydajność (bez rewelacji, ale solidnie) w środowisku DX9c.

Pod DX10, w rozdzielczości 1280x1024 uzyskuje ona nieco ponad 32 fps (średnio) - mierzone Frapsem, co jest wynikiem nieco gorszym od 9800GX2 (dwa rdzenie G92-450). Mając jednak na uwadze niedawną prezentację dema technologicznego FarCry 2 na karcie GTX 280, trudno nie oprzeć się wrażeniu, że jest to wina po części niedopracowanych sterowników, ale chyba przede wszystkim zupełnie innego sposobu obliczeń fizyki (GPU) w najnowszej odsłonie produktu Cryteka.

Testy wydajności GeForce GTX 280
Testy wydajności GeForce GTX 280

Podsumowanie

Nvidii nie można odmówić jednego. Potrafi doskonale wpasować się w aktualną sytuację rynkową z timingiem premier swoich nowych produktów. Z drugiej strony, niemal zawsze, w pierwszej kolejności są to układy z najwyższej półki, stąd popyt na nie do najwyższych należeć nie może. A jednak, jest to jeden ze sposobów na przekonanie do siebie także dużej rzeszy konsumentów wybierających kartę z niższego segmentu. Mając w swojej "stajni" najwydajniejszy i najbardziej złożony obecnie układ graficzny, NVIDIA pokazuje, że potrafi zaskakiwać, jeżeli nawet nie samą wydajnością pojedynczego rdzenia, to na pewno rozszerzoną funkcjonalnością GPU, który obecnie bez problemów może konkurować z jednostką centralną w wielu dziedzinach dedykowanych obliczeń.

Dużą korzyść może wreszcie przynieść realne wsparcie dla obliczeń fizyki PhysX, dzięki któremu w wielu nowoczesnych grach CPU przestanie być wąskim gardłem (efekt blokowania efektywnego renderingu scen 3D).

Na takie aplikacje przyjdzie nam jeszcze nieco poczekać. Już teraz jednak korzyści płynące z zastosowania niemal dwukrotnie większej liczby SP w stosunku do jednordzeniowych rozwiązań znanych z G80 czy G92, są bardzo widoczne. GTX 280 jest kartą o podobnej wydajności co "dwurdzeniowy" 9800GX2 w części dzisiejszych gier, przy rozdzielczościach rzędu 1680x1050. Przy większym obciążeniu AA/Aniso i rozdzielczościach HD jest już kartą wymiernie mocniejszą. Widać to doskonale po przyszłościowo pomyślanym teście 3dmark Vantage i profilach High, Extreme oraz wbudowanych weń feature testach.

dwie karty GeForce GTX 200 spięte w SLI

Image

W podsumowaniu nie może zabraknąć także wzmianki o zapotrzebowaniu "prądowym" najmłodszych "dżiforsów". Dla GTX 260 minimalnym wymaganym zasilaczem będzie taki, który posiada łącznie 36A na linii 12V (500W); dla GTX 280 potrzeba już 40A (550W). Maksymalne TDP na poziomie 236W oraz 186W wskazują na ciągłą tendencję wzrostową w tym zakresie kolejnych generacji kart graficznych.

Wyjątek stanowi rodzina GeForce 9, która jak się okazało, była tylko odświeżonym face-liftem rdzenia G80 z kilkoma usprawnieniami i mniejszym zapotrzebowaniem na energię. GT200 to rdzeń, który pomimo dość dużej prądożerności, wyznacza ścieżkę na przyszłość rozwiązaniom coraz bardziej kompleksowym, odciążając docelowo już niemal zupełnie CPU od obliczeń związanych z tworzeniem scen 3D, w tym, a może przede wszystkim ze zmiennoprzecinkowymi obliczeniami realistycznej fizyki.

chłodzona wodą konstrukcja EVGA e-GeForce 9800GX2 Hydro Cooper 18

Image

GTX 280 skierowany jest na chwilę obecną właściwie tylko do entuzjastów wydajności, a ukazanie się wersji chłodzonych wodą, wzorem 9800GX2, wydaje się już tylko kwestią czasu. Przy obecnym sposobie chłodzenia powietrzem, tak znacznie grzejącego się rdzenia, było by to rozwiązanie chyba najbardziej optymalne, zawężając przy tym jednak grono chętnych na inwestowanie w dodatkowy osprzęt potrzebny do zbudowania kompletnego systemu water-cooling'u. Moim skromnym zdaniem, przy wysokiej cenie tej karty, oraz względów całkowitych kosztów wydajnej platformy byłby to wybór bardzo racjonalny.

Na koniec nieco o zapowiadanych cenach kart GeForce GTX 260 / GTX 280.

Końcowa cena najmocniejszego obecnie GTX 280, kształtować ma się na poziomie 649 dolarów, co jak na absolutny rynkowy TOP wydaje się dla większości ceną stosunkowo wysoką. Dużo lepiej wyglądać będzie koszt zakupu GTX 260. Karta początkowo ma pojawić się w cenie 399 dolarów, a po premierze nowej rodziny ATI Radeon z serii HD4800 (329$ za HD4870) może spaść nawet do 349$. Pozostaje nam tylko czekać na większą dostępność tych kart i sensowne ceny w naszym kraju. Wg zapowiedzi ich początkowa dostępność będzie bardzo ograniczona.

Platforma testowa

  • AMD Phenom 8650 - Triple-Core, 2300MHz @ 2900MHz
    więcej informacji na temat procesora
     
  • MSI K9A2 Platinum rev1 (AMD 790FX) CrossFireX sAM2+ (bios v1.33beta)
  • Coolermaster Hyper TX2 sAM2
  • Kingston HyperX DDR2-1066 2x1GB CL 5-5-5-18 CMD 2T unganged mode
  • Seagate 250GB 7200.10 ST3250410AS 16MBcache NCQ
  • Chieftec CH-03-PA
  • Chieftec CFT-620-A12S

Sterowniki, system operacyjny i narzędzia:

  • Windows XP Professional SP3 PL
  • Windows VISTA Home Premium SP1 PL
  • DirectX March'08 update
  • amd: AMD X2 driver 1.3.2.0.53 - WinXP 
     
  • nvidia: ForceWare 169.32 whql / CRYSIS XP  - GeForce 8800GS
  • nvidia: ForceWare 169.44 beta / ETQW - GeForce 8600
  • nvidia: ForceWare 174.74 beta - GeForce 8 series - WinXP
  • nvidia: ForceWare 174.74 whql - GeForce 9 series - WinXP
  • nvidia: ForceWare 175.12 beta - GeForce 8/9 series - Vista
  • nvidia: ForceWare 175.16 whql / Assassin's Creed, HL2E2 - GeForce 9 series - Vista
  • nvidia: ForceWare 175.16 whql - 9600GT - Vista/XP
  • nvidia: ForceWare 177.26 beta - GTX 280 - Vista/XP 
     
  • ati: Catalyst 8.4 - WinXP
  • ati: Catalyst (8.471.1) Vantage Hotfix - Vista
  • ati: Catalyst 8.5 /  Assassin's Creed, HL2E2 - HD3870 G4, HD3870X2 - Vista 
     
  • GPU-Z 0.2.3
  • FRAPS 2.9.4
  • RivaTuner 2.09
  • Fur Stability Benchmark
  • ATiTool 0.27b4

Karty użyte do testu:

  • nvidia GeForce GTX 280 (602/1296/2214) 1GB (referencyjna)
  • ASUS GeForce 9800GX2 (602/1500/2000) 1GB
  • ASUS GeForce 9800GTX (675/1688/2200) 512MB
  • ASUS GeForce 8800GTS (650/1625/1950) 512MB
  • BFG GeForce 8800GT (625/1560/1800) 512MB OC
  • Gigabyte Gigabyte 9600GT (650/1750/1800) 512MB Zalman
  • MSI GeForce 9600GT (700/1680/1900) 512MB
  • ASUS GeForce 9600GT (650/1625/1800) 512MB SILENT
  • Gainward GeForce 8800GS (575/1438/1700) 384MB
  • Palit GeForce 8600GTS (675/1458/2016) 512MB Super
  • Palit GeForce 8600GT (621/1375/1800) 256MB Sonic+ 
     
  • ASUS Radeon HD3870X2 GDDR3 (825/1800) 1GB
  • Powercolor Radeon HD3870GDDR4 (776/2250) 512MB
  • Gigabyte Radeon HD3870 GDDR3 (776/1890) 512MB Zalman
  • ASUS Radeon HD3650 GDDR3 (725/1400) 512MB SILENT
  • ASUS Radeon HD3650 GDDR3 (725/1600) 256MB
Wybrane dla Ciebie
MOŻE JESZCZE JEDEN ARTYKUŁ? ZOBACZ CO POLECAMY