Karty graficzne

Architektura RV770

przeczytasz w 2 min.

RV770 to już kolejny GPU zdolny do wykonywania kodu ShaderModel 4.1 (zgodność z API DirectX10.1). Nowe Radeony, wprowadzają jednak nową jakość do sprawdzonej architektury znanej z poprzednich układów (R600 / RV670).

Układ oznaczony jako RV770 składa się z niemal miliarda tranzystorów (956 milionów), zajmując przy tym powierzchnię (die size) niewiele mniejszą od 260mm2. To już druga generacja wydajnych chipów ATI wykonywanych w procesie produkcyjnym 55nm. Lepsze opanowanie litografii w tym procesie, pozwoliło firmie znacznie obniżyć koszty produkcji pojedynczego krzemowego wafla. Docelowo ma to efektywnie wpłynąć na cenę finalnego produktu, i jak widać po początkowych cenach jest tak w rzeczywistości.

Kolejna generacja architektury superskalarnej ATI, to nie tylko znaczne usprawnienia wydajności poszczególnych bloków wykonawczych (zwielokrotnienie ich liczby) ale również likwidacja słabych punktów na drodze, którą pokonują dane w poszczególnych blokach.
Nowe układy RV770 zawierają już 160 jednostek SP, co w porównaniu do starszych układów (64) jest ilością ponad 2,5 krotnie większą.

Architektura USSA (Unified Superscalar Shader Architecture) / Terascale Engine

Znając wcześniejszą budowę "komórek" stream procesorowych z RV670, wiemy jednak doskonale, iż całościowo znajduje się ich tu znacznie więcej : (4+1)5 * 160 = 800! Nie dziwi zatem parametr teoretycznej wydajności chipa określany na poziomie 1-ego i więcej TeraFlopa. W nowo zaprojektowanym rdzeniu producent podzielił jednostki SIMD na klastry po 10 "rdzeni", z których każdy posiada po 80SPu.

jedna ze 160-ciu "komórek" zawierających (4+1) pojedynczych  SPu

ATI przebudowało także znaczną część rdzenia układu odpowiedzialną za efektywniejsze obliczenia arytmetyczno - logiczne wprowadzając, wzorem nvidii, dodatkowe 16KB bufory pamięci podręcznej (Local DataShare) dla każdego rdzenia SIMD, oraz (Global DataShare) do wymiany danych, alokacji i komunikacji pomiędzy 10 głównymi "rdzeniami" zawierającymi jednostki cieniujące SP. W strukturze obecnej architektury USSA (TeraScale Engine) znajduje się także 40 jednostek teksturujących (przypadających w liczbie po 4 na jeden z dziesięciu bloków SP), łącznie z dedykowanymi procesorami adresującymi TA.


schemat blokowy jednostki TU (Texture Unit)

Przebudowano także Render Back-Endy (RBE). Dzięki wsparciu dla funkcji "independent blending per  render target", oraz usprawnieniom w Z/Stencil (podwojenie możliwych do wykonania operacji na sekundę) uzyskano znacząco lepszą wydajność trybów MSAA.

schemat blokowy RBE (Render Back-End)

Double Precision (FP64) - podobnie jak ma to miejsce w nowym układzie nvidii (GT200), RV770 posiada zdolność do wykonywania instrukcji zmiennoprzecinkowych o podwójnej precyzji (FP64). Mogą one zostać wykorzystane przy obliczeniach wymagających wysokiej dokładności wyników (zastosowania dedykowane do tej pory CPU). ATi szacuje wydajność w trybie 64-bitowej precyzji na 240GFlopów, co jest wartością dwukrotnie wyższą od możliwej do uzyskania na chipie konkurencyjnej nvidii (GT200). Double Precision, zgodne z normą IEE 754, jest także porównywalne wydajnościowo z zastosowaniem 5-iu czterordzeniowych procesorów x86.

256-bitowy kontroler pamięci potrafi wykorzystać nie tylko moduły GDDR3 zasilane napięciem 2.0V, ale również najnowszy standard GDDR5 (moduły zasilane napięciem 1.5V) o wysokiej częstotliwości pracy. Co bardzo istotne nowe kości nie potrzebują już stosowania skomplikowanego układu ścieżek na PCB, stąd zmniejszają się tu koszty projektowania oraz produkcji gotowej płytki.

UVD2 - Universal Video Decoder, został usprawniony o możliwość sprzętowych transformacji materiału video wysokiej rozdzielczości (HD) jednocześnie na dwóch źródłach. Daje to możliwość realnego wykorzystania funkcji takich jak m.in. "obraz w obrazie" (P-I-P).