Karty graficzne

Specyfikacja kart: GeForce GTX 480 i GTX 470

z dnia 2010-03-26

Fermi, czyli nowa architektura kart GTX serii 400, jest nieco inna od tego z czym mieliśmy do czynienia w przypadku „dwusetek”. Według podawanej specyfikacji, karty oparte na układach GF100 wykonane w 40 nm litografii mają znacznie mniej klasycznych jednostek teksturujących. O czym dowiecie się w dalszej części artykułu, są one jednak znacznie szybsze. Poczynione usprawnienia spowodowały, że w nowych grach (szczególnie tych pisanych pod DX11) bardziej elastyczne jednostki będą wykonywać operacje znacznie sprawniej niż było to możliwe do tej pory.

Najmocniejszy obecnie układ graficzny na rynku zawiera 16 bloków procesorów strumieniowych. W każdym z nich znajdziemy po 32 rdzenie – pieszczotliwie nazywane – CUDA, których łączna liczba w danym modelu zależna jest od konfiguracji aktywnych jednostek.

I tak GeForce GTX 480 zawiera łącznie 480 Cc (CUDA Cores), co daje 15 aktywnych bloków SM. Gdzie się zatem podział ten szesnasty? Prawdopodobnie, po uporaniu się z dostawami obecnych kart, oraz opracowaniu bardziej efektywnego odbierania ciepła, ujrzymy niebawem jeszcze mocniejszą wersję karty, której najsensowniejszym oznaczeniem wydaje się GTX 490

Konfiguracja potokowa GTX 480, pomimo rezygnacji z bardziej rozbudowanego bloku TMU, prezentuje się okazale. 48 jednostek renderujących pomimo węższej szyny pamięci (384-bit – sześć 64 bitowych linii) przekłada się na zdolność do wypełnienia o ponad połowę większej ilości pikseli w ciągu jednego cyklu zegara aniżeli potrafił to zrobić GTX 285, a więc karta z 512-bitowym kontrolerem. Wykorzystanie pamięci GDDR5 dało także ogromną przepustowość całego podsystemu RAM, wynoszącą ponad 170 GB/s.

nazwa handlowa GeForce GTX 280 GeForce GTX 285 GeForce GTX 480
nazwa kodowa rdzenia GT200-A2 GT200-B1 GF100-375-A3
technologia wykonania 65nm 55nm 40nm
liczba tranzystorów 1.400 mln 1.400 mln 3.000 mln
powierzchnia rdzenia 576 mm2 470 mm2 530 mm2
specyfikacja API DX10 /SM4.0 DX10 /SM4.0 DX11 /SM5.0
maksymalne TDP 236 W 204 W 250 W
ilość jednostek rop 32 32 48
ilość jednostek adresujących TA 80 80 60
ilość jednostek tekst. TF 80 80 60
ilość jednostek SP 240 240 480
częstotliwość GPU 602 Mhz 648 Mhz 700 Mhz
wydajność wypełniania 48160 MT/s 51840 MT/s 42000 MT/s
częstotliwość shaderów 1296 Mhz 1476 Mhz 1401 Mhz
wydajność zmiennoprzecinkowa 933 GFlops 1063 GFlops 2017 GFlops
częstotliwość pamięci (QDR) 1107 Mhz (2214 DDR) 1242 Mhz (2484 DDR) 924 Mhz (3696 QDR)
przepustowość pamięci 138,4 GB/s 155,2 GB/s 173,2 GB/s
ilość i typ pamięci 1024MB GDDR3 1024MB GDDR3 1536MB GDDR5
szyna pamięci 512-bit 512-bit 384-bit
magistrala PCI-E 16x 2.0 PCI-E 16x 2.0 PCI-E 16x 2.0
chłodzenie dwuslotowe dwuslotowe dwuslotowe
sprzętowa obsługa formatów HD tak  (PureVideo HD 2nd gen) / VP3 tak (PureVideo HD 2nd gen) / VP3 tak (PureVideo HD 2nd gen) / VP4
multi-GPU Tri-SLi Tri-SLi Tri-SLi
dodatkowe zasilanie  1x 6pin / 1x8pin  2x 6pin
 1x 6pin / 1x 8pin

Nowy górnopółkowy GeForce ma zdolność do obliczeń zmiennoprzecinkowych ponad dwukrotnie wyższą od poprzednika. Ma być także ponad trzykrotnie szybszy w Ray-Tracingu i niemal ośmiokrotnie w przypadku obliczeń o podwojonej precyzji, a więc tam, gdzie GTX 285 znacznie odstawał od Radeonów HD 5800. W momencie praktycznego wykorzystania karty do obliczeń wątkowych będzie to na pewno bardzo istotna właściwość.

Jedyną rzeczą, którą na tym etapie można zarzucić karcie 480 GTX, jest podawane przez producenta TDP sięgające aż 250W. Jak na kartę wykonaną w nowym procesie 40 nm wydaje się to naprawdę dużo.

Drugą z premierowych kart jest GeForce GTX 470. Konstrukcja od mocniejszej wersji różni się nie tylko taktowaniem, ale także konfiguracją aktywnych bloków przetwarzania. Częstotliwość pracy ustalono na poziomie 607 MHz dla układu, 1215 MHz dla rdzeni CUDA oraz 837 MHz dla pamięci GDDR5 (efektywnie 3348 MHz). Zwężona do 320-bitów szyna oraz ograniczenie ROP do 40 jednostek powodują, że przepustowość podsystemu pamięci jest tu znacząco mniejsza i wynosi około 130 GB/s.



Modelowi GTX 470 „zabrano” ponadto kolejny klaster SM. Do dyspozycji pozostaje ich zatem 14, co daje łączną liczbę 448 aktywnych jednostek CUDA Cores. Z ośmiu do siedmiu zmniejszono także ilość klastrów jednostek teksturujących. Wersja 470 ma ich 56.

nazwa handlowa GeForce GTX 260-196 GeForce GTX 260-216 GeForce GTX 470
nazwa kodowa rdzenia GT200-A2 GT200-B1 GF100-275-A3
technologia wykonania 65nm 55nm 40nm
liczba tranzystorów 1.400 mln 1.400 mln    3.000 mln
powierzchnia rdzenia 576 mm2 470 mm2    530 mm2
specyfikacja API DX10 /SM4.0 DX10 /SM4.0 DX11 /SM5.0
maksymalne TDP 186 W 206 W 215 W
ilość jednostek rop 28 28 40
ilość jednostek adresujących TA 64 72 56
ilość jednostek tekst. TF 64 72 56
ilość jednostek SP 196 216 448
częstotliwość GPU 576 Mhz 576 Mhz 607 Mhz
wydajność wypełniania 36864 MT/s 41472 MT/s 33992 MT/s
częstotliwość shaderów 1296 Mhz 1476 Mhz    1401 Mhz
wydajność zmiennoprzecinkowa 715 GFlops 805 GFlops 1633 GFlops
częstotliwość pamięci 999 Mhz (1998 DDR) 999 Mhz (1998 DDR) 837 Mhz (3348 Mhz QDR)
przepustowość pamięci 109,2 GB/s 109,2 GB/s 130,8 GB/s
ilość i typ pamięci 896MB GDDR3 896MB GDDR3 1280MB GDDR5
szyna pamięci 448-bit 448-bit 320-bit
magistrala PCI-E 16x 2.0 PCI-E 16x 2.0 PCI-E 16x 2.0
chłodzenie dwuslotowe dwuslotowe dwuslotowe
sprzętowa obsługa formatów HD tak  (PureVideo HD 2nd gen) / VP3 tak  (PureVideo HD 2nd gen) / VP3 tak  (PureVideo HD 2nd gen) / VP4
multi-GPU Tri-SLi Tri-SLi Tri-SLi
dodatkowe zasilanie 2x 6pin 2x 6pin 2x 6pin

TDP karty ustalono na poziomie 215W, co odpowiada miej więcej apetytowi na prąd wersji 275 poprzedniej generacji.

Obydwie karty są zgodne z modelem programowania procesorów graficznych SM 5.0. Obsługują w pełni API DirectX11, DirectCompute11 oraz Open CL. Bardziej optymalne wykorzystanie zasobów geometrycznych rdzenia powoduje też znaczne przyspieszenie w obliczeniach realistycznej fizyki PhysX.

Tańszy model karty został wyposażony w 1280 MB dedykowanej pamięci. Mocniejszy natomiast zawiera jej około 1,5 GB. Do niestandardowych pojemności w przypadku NVIDII zdążyliśmy się już przyzwyczaić i jak dobrze pamiętamy związane jest to bezpośrednio z konfiguracją jednostek adresowych w ROP-ach.

Obydwie nowe konstrukcje już niebawem będziecie mogli także porównywać w naszym komparatorze GPU.