Karty graficzne

Chip RV790 – zmiany na lepsze

opublikowano przez Sebastian Swarcewicz w dniu 2009-04-01

Jak już wspomniałem układ RV790 to poddana liftingowi i nieco lepiej zoptymalizowana wersja (rewizja) rdzenia RV770xt znanego doskonale z kart Radeon HD4870. Pod kątem osiągnięcia wyższej częstotliwości pracy, optymalizacji dokonano w kilku wymiarach. Zmieniono czasy dostępu do poszczególnych bloków i pamięci podręcznej, a także „przemodelowano” dystrybucję i rozkład pobieranej i rozpraszanej energii wewnątrz układu. Cały rdzeń został ponadto „zabezpieczony” specjalnym pierścieniem kondensatorów „odprzęgających”, redukując tym samym interferencje sygnałów jakie mogłyby zakłócić jego pracę z wysokimi częstotliwościami. Choć na pierwszy rzut oka zmiany wydają się raczej kosmetyczne, w efekcie poskutkowały nieznacznym zwiększeniem ilości tranzystorów budujących układ z 956 do 959mln.

Umiejscowienie bloków SIMD (SPu) oraz TU (TF/TA)

Architektura RV790 poza wspomnianymi wyżej optymalizacjami w zasadniczy sposób nie różni się od starszego brata (RV770). Cały czas mamy więc do czynienia z wydajną architekturą Terascale składającą się z 800 pojedynczych jednostek SIMD, które wspomagane przez 40 jednostek teksturujących oraz 16 ROPów (w przypadku ATI tzw. Render Back Endów) odpowiadają za niesamowitą wręcz (jak na pojedynczy układ) wydajność zmiennoprzecinkową wynoszącą 1,36TFlopsa. O architekturze Terascale szerzej pisałem w artykule „Testujemy Radeona HD4850”, z którym mogliście się zapoznać pod koniec czerwca zeszłego roku. Bardziej dociekliwych zachęcam więc do sięgnięcia w nasze archiwalia.

Schemat blokowy architektury układów RV770/790

Z zewnątrz sama karta do złudzenia przypomina Radeona HD4870. Nic w tym dziwnego, jest to przecież jego ewolucyjny następca. Elektroniczny „Darwin” przyszłości nie powinien mieć tu żadnych złudzeń :)

Porównanie: Radeon HD4890 (u góry), Radeon HD4870 (na dole)

Jeżeli z zewnątrz większych zmian nie widać, poza rzecz jasna nową szatą graficzną chłodzenia, to znajdują się one wewnątrz plastikowej „puszki” z wentylatorem. Serce tego modułu tworzy bardzo podobny jak w HD4870 radiator wykorzystujący układ „sprasowanych”, cienkich aluminiowych finów. Z miejsca styku tego bloku z powierzchnią rdzenia RV790 wychodzą już jednak nie dwa, a aż trzy miedziane heat-pipe'y (ciepłowody transportujące ciepło).

Wraz z premierą nowych układów w czerwcu zeszłego roku, wspominaliśmy o przygotowywanym  sprzętowym wsparciu dla obliczeń złożonej fizyki na bazie bardzo popularnego silnika fizyki jakim jest Havok. Jako że firma nawet pomimo znacznego upływu czasu raczej zawsze przechodzi od słów do czynów, takie wsparcie będzie już niebawem dostępne. Może się więc okazać, iż już niedługo na rynku będą ze sobą koegzystować tytuły gier, wymagające do pełnej zabawy z jednej strony GeForce'a (nvidia PhysX), a z drugiej Radeona (Havok). Oczywiście na obydwu rodzinach tych kart uda nam się bez przeszkód zagrać w każdy taki tytuł. Małym problemem może być jednak słaba wydajność silnika fizyki w momencie, kiedy zamiast GPU tymi operacjami zajmie się jednostka centralna (CPU). Dla użytkowników będzie to więc sztuka pewnego kompromisu, a dla producentów dalszej marketingowej walki „na wspierane przez dany silnik tytuły”, co chyba w dłuższej perspektywie czasu nie będzie zwiastować nic miłego.

Producent, grając nieco na nosie Microsoftowi (DirectX11), zaczyna coraz poważniej podchodzić także do wsparcia dla otwartego API jakim jest OpenCL (Open Computing Language). Interfejs ten pozwala na efektywne wykorzystanie jednostek stream procesorów na potrzeby między innymi autorskiego ATi Stream.

Pod koniec marca ATi/AMD ukończyło prace nad własnym środowiskiem programistycznym wykorzystującym przetwarzanie wątkowe w oparciu o OpenCL. Jak nie trudno się domyśleć, jest to odpowiedź na CUDA nvidii, które do tej pory zdobyło sobie już sporą przychylność zainteresowanych tym interfejsem użytkowników. Jeśli programiści zaczną korzystać ze środowiska Stream równie chętnie co z CUDA, w niedługim czasie powinniśmy się spodziewać prawdziwego wysypu aplikacji korzystających i z tego programistycznego interfejsu.

W odróżnieniu od nvidii cieszy jednak coraz bardziej przychylne spojrzenie w stronę otwartych standardów takich jak chociażby wspomniany OpenCL. Co z tego jednak wyjdzie i jakie korzyści osiągnie na tym przeciętny użytkownik przekonamy się już w niebawem.

Już teraz jednak studia graficzne opuszcza cała masa gier wspierających API DirectX10.1, oferując nie tylko jeszcze wyższą precyzję i jakość obrazu, ale także pozwalających Radeonom osiągać w stosunku do konkurencyjnego GeForce'a znacznie lepsze rezultaty. Najważniejsze jednak aby tytuły te nie okazały się stricte niszowymi. Choć spoglądając na te które już istnieją, takie jak chociażby „Stalker Czyste Niebo”, „Storm Rise” czy „Tom Clancy's H-A-W-X”, oraz na te które mają się dopiero ukazać - np. „Battle Forge”, można dojść do wniosku że stać się tak raczej nie powinno.