Karty graficzne

RV670, czyli R600 na diecie

przeczytasz w 3 min.

Nowe układy nie różnią się znacznie pod względem budowy od układu R600 będącego sercem kart HD2900. Zmiany dotyczą bloków zunifikowanych shaderów (zdolności do wykonywania kodu Shader Model 4.1) oraz węższej o połowę szyny pamięci, pracującej w układzie RingBus. Wszystko upakowano w 666 mln tranzystorów, wykonanych w 55 nanometrowym procesie produkcyjnym. Zmniejszono napięcie zasilające rdzeń, dając karcie nieco "odetchnąć" jeżeli chodzi o wydzielane ciepło. Maksymalne TDP dla Radeona HD3870 wynosi ~105W, a dla HD3850 ~90-95W. To bardzo mało patrząc na pobór mocy poprzednika opartego o R600 180~200W.

 

 

GeForce
8800 GT

Radeon
HD 2900XT

Radeon
HD 3870

Radeon
HD 3850

nazwa kodowa
liczba tranzystorów
techn. wykonania
G92
754 mln
65nm
R600
700 mln
80nm
RV670
666 mln
55nm
R670
666 mln
55nm
maksymalne TDP
~110W
~200W
~105W
~90W
potoki renderujące
16
16(4rbe)
16(4rbe)
16(4rbe)
ilość proces. strumieni
112
64/320
64/320
64/320
częstot. rdzenia
częstot. VS
600 MHz
1512 MHz
742 MHz
780 MHz
670 MHz
wydajność Gflops
wydajność MTtex/s
508 Gflops
33,600
475 Gflops
24,000
499 Gflops
33,600
429 Gflops
36,800
częstotliwość pamięci
900 MHz
(efekt. 1800)
826 MHz
(efekt. 1655)
1126 MHz
(efekt. 2250)
826 MHz
(efekt. 1655)
przepustowość pamięci
~56 GB/sek.
~103 GB/sek.
~70 GB/sek.
~52 GB/sek.
rozmiar pamięci
szyna danych pamięci
512 MB
256-bitowa
512 MB
512-bitowa
512 MB
256-bitowa
256 MB
256-bitowa
HDMI
tak
tak
+ Audio 5.1
tak
+ Audio 5.1
tak
+ Audio 5.1
sprzętowa obsługa formatów HD
tak (PureVideo HD 2 gen)
tak
(AvivoHD)
tak (AvivoHD) / UVD
tak (AvivoHD) / UVD
magistrala
PCI-E 16x (v1.1/v2.0)
PCI-E 16x (v1.1)
PCI-E 16x (v1.1/v2.0)
PCI-E 16x (v1.1/v2.0)
chłodzenie
aktywne
jedno-slotowe
aktywne
dwu-slotowe
aktywne
dwu-slotowe
aktywne
jedno-slotowe

Procesor graficzny RV670 ma tyle samo jednostek wykonawczych co HD2900XT, a więc łącznie 16 render back-ends (4 jednostki podzielone na 4 bloki), oraz 16 jednostek teksturujących TMU (adres i filter). Jednostka zunifikowanych shaderów to 64 stream procesory zdolne wykonać do 320 instrukcji na cykl pracy.
Dzięki zmniejszeniu procesu produkcji, a co za tym idzie, zmniejszeniu wydzielanego ciepła, Radeon HD3850 zadowala się jednoslotowym chłodzeniem, podobnie zresztą jak nowy GeForce 8800GT nvidii. Wentylator na produkcie ATI jest jednak nieco cichszy w górnej partii obrotów i wg producenta charakteryzuje się głosnością ~31dB. "Dwuslotowy" HD3870 jest niewiele głośniejszy i jego średnie parametry "odsłuchowe" to 34dB.

Radeon HD3870 jest kartą Radeon HD trzeciej generacji (3), należącym do rodziny układów wydajnych (8), w wariancie "mocniejszym" (70), czyli dawnym odpowiedniku oznaczenia XT. HD3850 zatem to odpowiednik kart znanych jako wariant PRO.


DirectX 10.1 - Shader "Model" po liftingu

 

Wprowadzanie w układach graficznych coraz bardziej złożonych bloków odpowiedzialnych za przetwarzanie skomplikowanych obliczeń na shaderach jest chyba najważniejszą dziedziną ich rozwoju w ostatnim czasie. Nie ulega wątpliwości, że dzisiejsze oprogramowanie (w tym głównie gry) nie nadążają za postępem w dziedzinie sprzętu. API DirectX10 wprowadzone wraz z systemem Vista, wywołało u większości graczy mieszane odczucia, a co dla niektórych nawet pewien niesmak. To co miało oznaczać większą wydajność, lepszy obraz, mniejsze obciążenie jednostki centralnej okazało się w znacznej części mrzonką. Już dziś można stwierdzić, że obecne karty segmentu średniego, czy średniego - wyższego nie poradzą sobie w tym trybie na tak zoptymalizowanych programach jakie wypuszczane są do tej pory.

Wprowadzenie poprawionego "dajrekt iksa" w nowych układach ATI RV670, znów wprowadza nieco zamieszania natury "specyfikacyjnej".  To, że karty są nowoczesne, nie ulega wątpliwości, tyle, że na chwilę obecną nic z tego wynikać nie będzie - brak oprogramowania (gier), oraz co ważniejsze odpowiednich bibliotek DX, które ma wprowadzić pierwszy Service Pack do Windows Vista. Wg wstępnych zapowiedzi jednak, nie będzie gier pisanych specjalnie pod to API, a tylko stosowne łatki pozwalające uzyskać wymiernie lepszą jakość obrazu (wyższa precyzja shaderów, wyższa precyzja filtrowania tekstur, czy poprawione custom i adaptive AA).

Warto jednak wiedzieć, jakie korzyści uzyskamy używając kart budowanych w niedalekiej przyszłości, oraz czy warto się nad tym w ogóle zastanawiać.

Czym zatem różni się nowy model cieniowania (SM4.1) od poprzedniego (SM4.0)? Ponieważ to, że ostatnią liczbą po przecinku, raczej wszyscy wiemy ;) Czym ponadto?

Główne zmiany dotyczą zniesienia kilku ograniczeń SM4.0, między innymi precyzji oświetlenia globalnego (global illumination) - miękkie cienie, realistyczne refleksy. W nowym modelu cieniowania programiści mogą już korzystać z większej ilości "cube map" i możliwości shadera geometrii aby tworzyć w/w efekty w czasie rzeczywistym. Technika ta jest także bardziej skalowalna z liczbą zastosowanych układów graficznych (lepsza optymalizacja CrossFireX).

Dużo zmian poczyniono także poprzez zwiększenie precyzji obliczeń (pixel / vertex) shaderowych, co może mieć wymierny wpływ na jakość obrazu przy użyciu gier z obsługą tego API.
Dość znacznym usprawnieniem może poszczycić się także jednostka filtrująca/teksturująca zdolna obecnie do operowania na 32-bitowych danych zmiennoprzecinkowych.

generowanie bardziej realistycznych miękkich cieni, na podstawie specjalnej tekstury, dzięki technice Gather4
(4 próbki koloru, łącznie z blendingiem, pobierane w  tym samym czasie)

ATI/AMD ponadto, chwali się poprawioną wydajnością i elastycznością trybów MSAA, w tym CustomAA. W nowym "Shader Modelu" wszystkie bufory próbek anty-aliasingu będą dostępne bezpośrednio z poziomu shaderów. Poprzednio niemożliwym było sięgnąć do bufora głębi dla każdej takiej próbki indywidualnie. Wg. producenta układu daje to programistom większą swobodę przy implementacji CustomAA, odwołując się do hardware'u bezpośrednio poprzez programy shaderowe. Obecnie antyaliasing jest piętą achillesową całej serii Radeon HD, właśnie za sprawą niedopracowanych driverów, ale i wynikających z kilku ograniczeń specyfikacji DirectX10 i jej obsługi przez te układy. Warto zatem poczekać na pierwsze "protezy" DX10.1 dla gier i ocenić czy zmiany wpłyną w jakikolwiek sposób na podniesienie wydajności przy użyciu "bardziej programowalnego" wygładzania krawędzi.