Karty graficzne

Specyfikacja kart: GeForce GTX 480 i GTX 470

przeczytasz w 2 min.

Fermi, czyli nowa architektura kart GTX serii 400, jest nieco inna od tego z czym mieliśmy do czynienia w przypadku „dwusetek”. Według podawanej specyfikacji, karty oparte na układach GF100 wykonane w 40 nm litografii mają znacznie mniej klasycznych jednostek teksturujących. O czym dowiecie się w dalszej części artykułu, są one jednak znacznie szybsze. Poczynione usprawnienia spowodowały, że w nowych grach (szczególnie tych pisanych pod DX11) bardziej elastyczne jednostki będą wykonywać operacje znacznie sprawniej niż było to możliwe do tej pory.

Najmocniejszy obecnie układ graficzny na rynku zawiera 16 bloków procesorów strumieniowych. W każdym z nich znajdziemy po 32 rdzenie – pieszczotliwie nazywane – CUDA, których łączna liczba w danym modelu zależna jest od konfiguracji aktywnych jednostek.

I tak GeForce GTX 480 zawiera łącznie 480 Cc (CUDA Cores), co daje 15 aktywnych bloków SM. Gdzie się zatem podział ten szesnasty? Prawdopodobnie, po uporaniu się z dostawami obecnych kart, oraz opracowaniu bardziej efektywnego odbierania ciepła, ujrzymy niebawem jeszcze mocniejszą wersję karty, której najsensowniejszym oznaczeniem wydaje się GTX 490

Konfiguracja potokowa GTX 480, pomimo rezygnacji z bardziej rozbudowanego bloku TMU, prezentuje się okazale. 48 jednostek renderujących pomimo węższej szyny pamięci (384-bit – sześć 64 bitowych linii) przekłada się na zdolność do wypełnienia o ponad połowę większej ilości pikseli w ciągu jednego cyklu zegara aniżeli potrafił to zrobić GTX 285, a więc karta z 512-bitowym kontrolerem. Wykorzystanie pamięci GDDR5 dało także ogromną przepustowość całego podsystemu RAM, wynoszącą ponad 170 GB/s.

nazwa handlowaGeForce GTX 280GeForce GTX 285GeForce GTX 480
nazwa kodowa rdzeniaGT200-A2GT200-B1GF100-375-A3
technologia wykonania65nm55nm40nm
liczba tranzystorów1.400 mln1.400 mln3.000 mln
powierzchnia rdzenia576 mm2470 mm2530 mm2
specyfikacja APIDX10 /SM4.0DX10 /SM4.0DX11 /SM5.0
maksymalne TDP236 W204 W250 W
ilość jednostek rop323248
ilość jednostek adresujących TA808060
ilość jednostek tekst. TF808060
ilość jednostek SP240240480
częstotliwość GPU602 Mhz648 Mhz700 Mhz
wydajność wypełniania48160 MT/s51840 MT/s42000 MT/s
częstotliwość shaderów1296 Mhz1476 Mhz1401 Mhz
wydajność zmiennoprzecinkowa933 GFlops1063 GFlops2017 GFlops
częstotliwość pamięci (QDR)1107 Mhz (2214 DDR)1242 Mhz (2484 DDR)924 Mhz (3696 QDR)
przepustowość pamięci138,4 GB/s155,2 GB/s173,2 GB/s
ilość i typ pamięci1024MB GDDR31024MB GDDR31536MB GDDR5
szyna pamięci512-bit512-bit384-bit
magistralaPCI-E 16x 2.0PCI-E 16x 2.0PCI-E 16x 2.0
chłodzeniedwuslotowedwuslotowedwuslotowe
sprzętowa obsługa formatów HDtak  (PureVideo HD 2nd gen) / VP3tak (PureVideo HD 2nd gen) / VP3tak (PureVideo HD 2nd gen) / VP4
multi-GPUTri-SLiTri-SLiTri-SLi
dodatkowe zasilanie 1x 6pin / 1x8pin 2x 6pin
 1x 6pin / 1x 8pin

Nowy górnopółkowy GeForce ma zdolność do obliczeń zmiennoprzecinkowych ponad dwukrotnie wyższą od poprzednika. Ma być także ponad trzykrotnie szybszy w Ray-Tracingu i niemal ośmiokrotnie w przypadku obliczeń o podwojonej precyzji, a więc tam, gdzie GTX 285 znacznie odstawał od Radeonów HD 5800. W momencie praktycznego wykorzystania karty do obliczeń wątkowych będzie to na pewno bardzo istotna właściwość.

Jedyną rzeczą, którą na tym etapie można zarzucić karcie 480 GTX, jest podawane przez producenta TDP sięgające aż 250W. Jak na kartę wykonaną w nowym procesie 40 nm wydaje się to naprawdę dużo.

Drugą z premierowych kart jest GeForce GTX 470. Konstrukcja od mocniejszej wersji różni się nie tylko taktowaniem, ale także konfiguracją aktywnych bloków przetwarzania. Częstotliwość pracy ustalono na poziomie 607 MHz dla układu, 1215 MHz dla rdzeni CUDA oraz 837 MHz dla pamięci GDDR5 (efektywnie 3348 MHz). Zwężona do 320-bitów szyna oraz ograniczenie ROP do 40 jednostek powodują, że przepustowość podsystemu pamięci jest tu znacząco mniejsza i wynosi około 130 GB/s.



Modelowi GTX 470 „zabrano” ponadto kolejny klaster SM. Do dyspozycji pozostaje ich zatem 14, co daje łączną liczbę 448 aktywnych jednostek CUDA Cores. Z ośmiu do siedmiu zmniejszono także ilość klastrów jednostek teksturujących. Wersja 470 ma ich 56.

nazwa handlowaGeForce GTX 260-196GeForce GTX 260-216GeForce GTX 470
nazwa kodowa rdzeniaGT200-A2GT200-B1GF100-275-A3
technologia wykonania65nm55nm40nm
liczba tranzystorów1.400 mln1.400 mln   3.000 mln
powierzchnia rdzenia576 mm2470 mm2   530 mm2
specyfikacja APIDX10 /SM4.0DX10 /SM4.0DX11 /SM5.0
maksymalne TDP186 W206 W215 W
ilość jednostek rop282840
ilość jednostek adresujących TA647256
ilość jednostek tekst. TF647256
ilość jednostek SP196216448
częstotliwość GPU576 Mhz576 Mhz607 Mhz
wydajność wypełniania36864 MT/s41472 MT/s33992 MT/s
częstotliwość shaderów1296 Mhz1476 Mhz   1401 Mhz
wydajność zmiennoprzecinkowa715 GFlops805 GFlops1633 GFlops
częstotliwość pamięci999 Mhz (1998 DDR)999 Mhz (1998 DDR)837 Mhz (3348 Mhz QDR)
przepustowość pamięci109,2 GB/s109,2 GB/s130,8 GB/s
ilość i typ pamięci896MB GDDR3896MB GDDR31280MB GDDR5
szyna pamięci448-bit448-bit320-bit
magistralaPCI-E 16x 2.0PCI-E 16x 2.0PCI-E 16x 2.0
chłodzeniedwuslotowedwuslotowedwuslotowe
sprzętowa obsługa formatów HDtak  (PureVideo HD 2nd gen) / VP3tak  (PureVideo HD 2nd gen) / VP3tak  (PureVideo HD 2nd gen) / VP4
multi-GPUTri-SLiTri-SLiTri-SLi
dodatkowe zasilanie2x 6pin2x 6pin2x 6pin

TDP karty ustalono na poziomie 215W, co odpowiada miej więcej apetytowi na prąd wersji 275 poprzedniej generacji.

Obydwie karty są zgodne z modelem programowania procesorów graficznych SM 5.0. Obsługują w pełni API DirectX11, DirectCompute11 oraz Open CL. Bardziej optymalne wykorzystanie zasobów geometrycznych rdzenia powoduje też znaczne przyspieszenie w obliczeniach realistycznej fizyki PhysX.

Tańszy model karty został wyposażony w 1280 MB dedykowanej pamięci. Mocniejszy natomiast zawiera jej około 1,5 GB. Do niestandardowych pojemności w przypadku NVIDII zdążyliśmy się już przyzwyczaić i jak dobrze pamiętamy związane jest to bezpośrednio z konfiguracją jednostek adresowych w ROP-ach.

Obydwie nowe konstrukcje już niebawem będziecie mogli także porównywać w naszym komparatorze GPU.