Specyfikacja kart: GeForce GTX 480 i GTX 470

26 marca 2010przeczytasz w 2 min.

Fermi, czyli nowa architektura kart GTX serii 400, jest nieco inna od tego z czym mieliśmy do czynienia w przypadku „dwusetek”. Według podawanej specyfikacji, karty oparte na układach GF100 wykonane w 40 nm litografii mają znacznie mniej klasycznych jednostek teksturujących. O czym dowiecie się w dalszej części artykułu, są one jednak znacznie szybsze. Poczynione usprawnienia spowodowały, że w nowych grach (szczególnie tych pisanych pod DX11) bardziej elastyczne jednostki będą wykonywać operacje znacznie sprawniej niż było to możliwe do tej pory.

Najmocniejszy obecnie układ graficzny na rynku zawiera 16 bloków procesorów strumieniowych. W każdym z nich znajdziemy po 32 rdzenie – pieszczotliwie nazywane – CUDA, których łączna liczba w danym modelu zależna jest od konfiguracji aktywnych jednostek.

I tak GeForce GTX 480 zawiera łącznie 480 Cc (CUDA Cores), co daje 15 aktywnych bloków SM. Gdzie się zatem podział ten szesnasty? Prawdopodobnie, po uporaniu się z dostawami obecnych kart, oraz opracowaniu bardziej efektywnego odbierania ciepła, ujrzymy niebawem jeszcze mocniejszą wersję karty, której najsensowniejszym oznaczeniem wydaje się GTX 490.

Konfiguracja potokowa GTX 480, pomimo rezygnacji z bardziej rozbudowanego bloku TMU, prezentuje się okazale. 48 jednostek renderujących pomimo węższej szyny pamięci (384-bit – sześć 64 bitowych linii) przekłada się na zdolność do wypełnienia o ponad połowę większej ilości pikseli w ciągu jednego cyklu zegara aniżeli potrafił to zrobić GTX 285, a więc karta z 512-bitowym kontrolerem. Wykorzystanie pamięci GDDR5 dało także ogromną przepustowość całego podsystemu RAM, wynoszącą ponad 170 GB/s.

nazwa handlowa	GeForce GTX 280	GeForce GTX 285	GeForce GTX 480
nazwa kodowa rdzenia	GT200-A2	GT200-B1	GF100-375-A3
technologia wykonania	65nm	55nm	40nm
liczba tranzystorów	1.400 mln	1.400 mln	3.000 mln
powierzchnia rdzenia	576 mm2	470 mm2	530 mm2
specyfikacja API	DX10 /SM4.0	DX10 /SM4.0	DX11 /SM5.0
maksymalne TDP	236 W	204 W	250 W
ilość jednostek rop	32	32	48
ilość jednostek adresujących TA	80	80	60
ilość jednostek tekst. TF	80	80	60
ilość jednostek SP	240	240	480
częstotliwość GPU	602 Mhz	648 Mhz	700 Mhz
wydajność wypełniania	48160 MT/s	51840 MT/s	42000 MT/s
częstotliwość shaderów	1296 Mhz	1476 Mhz	1401 Mhz
wydajność zmiennoprzecinkowa	933 GFlops	1063 GFlops	2017 GFlops
częstotliwość pamięci (QDR)	1107 Mhz (2214 DDR)	1242 Mhz (2484 DDR)	924 Mhz (3696 QDR)
przepustowość pamięci	138,4 GB/s	155,2 GB/s	173,2 GB/s
ilość i typ pamięci	1024MB GDDR3	1024MB GDDR3	1536MB GDDR5
szyna pamięci	512-bit	512-bit	384-bit
magistrala	PCI-E 16x 2.0	PCI-E 16x 2.0	PCI-E 16x 2.0
chłodzenie	dwuslotowe	dwuslotowe	dwuslotowe
sprzętowa obsługa formatów HD	tak (PureVideo HD 2nd gen) / VP3	tak (PureVideo HD 2nd gen) / VP3	tak (PureVideo HD 2nd gen) / VP4
multi-GPU	Tri-SLi	Tri-SLi	Tri-SLi
dodatkowe zasilanie	1x 6pin / 1x8pin	2x 6pin	1x 6pin / 1x 8pin

Nowy górnopółkowy GeForce ma zdolność do obliczeń zmiennoprzecinkowych ponad dwukrotnie wyższą od poprzednika. Ma być także ponad trzykrotnie szybszy w Ray-Tracingu i niemal ośmiokrotnie w przypadku obliczeń o podwojonej precyzji, a więc tam, gdzie GTX 285 znacznie odstawał od Radeonów HD 5800. W momencie praktycznego wykorzystania karty do obliczeń wątkowych będzie to na pewno bardzo istotna właściwość.

Jedyną rzeczą, którą na tym etapie można zarzucić karcie 480 GTX, jest podawane przez producenta TDP sięgające aż 250W. Jak na kartę wykonaną w nowym procesie 40 nm wydaje się to naprawdę dużo.

Drugą z premierowych kart jest GeForce GTX 470. Konstrukcja od mocniejszej wersji różni się nie tylko taktowaniem, ale także konfiguracją aktywnych bloków przetwarzania. Częstotliwość pracy ustalono na poziomie 607 MHz dla układu, 1215 MHz dla rdzeni CUDA oraz 837 MHz dla pamięci GDDR5 (efektywnie 3348 MHz). Zwężona do 320-bitów szyna oraz ograniczenie ROP do 40 jednostek powodują, że przepustowość podsystemu pamięci jest tu znacząco mniejsza i wynosi około 130 GB/s.

Modelowi GTX 470 „zabrano” ponadto kolejny klaster SM. Do dyspozycji pozostaje ich zatem 14, co daje łączną liczbę 448 aktywnych jednostek CUDA Cores. Z ośmiu do siedmiu zmniejszono także ilość klastrów jednostek teksturujących. Wersja 470 ma ich 56.

nazwa handlowa	GeForce GTX 260-196	GeForce GTX 260-216	GeForce GTX 470
nazwa kodowa rdzenia	GT200-A2	GT200-B1	GF100-275-A3
technologia wykonania	65nm	55nm	40nm
liczba tranzystorów	1.400 mln	1.400 mln	3.000 mln
powierzchnia rdzenia	576 mm2	470 mm2	530 mm2
specyfikacja API	DX10 /SM4.0	DX10 /SM4.0	DX11 /SM5.0
maksymalne TDP	186 W	206 W	215 W
ilość jednostek rop	28	28	40
ilość jednostek adresujących TA	64	72	56
ilość jednostek tekst. TF	64	72	56
ilość jednostek SP	196	216	448
częstotliwość GPU	576 Mhz	576 Mhz	607 Mhz
wydajność wypełniania	36864 MT/s	41472 MT/s	33992 MT/s
częstotliwość shaderów	1296 Mhz	1476 Mhz	1401 Mhz
wydajność zmiennoprzecinkowa	715 GFlops	805 GFlops	1633 GFlops
częstotliwość pamięci	999 Mhz (1998 DDR)	999 Mhz (1998 DDR)	837 Mhz (3348 Mhz QDR)
przepustowość pamięci	109,2 GB/s	109,2 GB/s	130,8 GB/s
ilość i typ pamięci	896MB GDDR3	896MB GDDR3	1280MB GDDR5
szyna pamięci	448-bit	448-bit	320-bit
magistrala	PCI-E 16x 2.0	PCI-E 16x 2.0	PCI-E 16x 2.0
chłodzenie	dwuslotowe	dwuslotowe	dwuslotowe
sprzętowa obsługa formatów HD	tak (PureVideo HD 2nd gen) / VP3	tak (PureVideo HD 2nd gen) / VP3	tak (PureVideo HD 2nd gen) / VP4
multi-GPU	Tri-SLi	Tri-SLi	Tri-SLi
dodatkowe zasilanie	2x 6pin	2x 6pin	2x 6pin

TDP karty ustalono na poziomie 215W, co odpowiada miej więcej apetytowi na prąd wersji 275 poprzedniej generacji.

Obydwie karty są zgodne z modelem programowania procesorów graficznych SM 5.0. Obsługują w pełni API DirectX11, DirectCompute11 oraz Open CL. Bardziej optymalne wykorzystanie zasobów geometrycznych rdzenia powoduje też znaczne przyspieszenie w obliczeniach realistycznej fizyki PhysX.

Tańszy model karty został wyposażony w 1280 MB dedykowanej pamięci. Mocniejszy natomiast zawiera jej około 1,5 GB. Do niestandardowych pojemności w przypadku NVIDII zdążyliśmy się już przyzwyczaić i jak dobrze pamiętamy związane jest to bezpośrednio z konfiguracją jednostek adresowych w ROP-ach.

Obydwie nowe konstrukcje już niebawem będziecie mogli także porównywać w naszym komparatorze GPU.