Sebastian Swarcewicz | 2008-06-25

Premiera nowej grafiki AMD Radeon HD 4800. Testujemy Radeona 4850

kategoria: karty graficzne

producenci: AMD, ATi

 

Architektura RV770

RV770 to już kolejny GPU zdolny do wykonywania kodu ShaderModel 4.1 (zgodność z API DirectX10.1). Nowe Radeony, wprowadzają jednak nową jakość do sprawdzonej architektury znanej z poprzednich układów (R600 / RV670).

Układ oznaczony jako RV770 składa się z niemal miliarda tranzystorów (956 milionów), zajmując przy tym powierzchnię (die size) niewiele mniejszą od 260mm2. To już druga generacja wydajnych chipów ATI wykonywanych w procesie produkcyjnym 55nm. Lepsze opanowanie litografii w tym procesie, pozwoliło firmie znacznie obniżyć koszty produkcji pojedynczego krzemowego wafla. Docelowo ma to efektywnie wpłynąć na cenę finalnego produktu, i jak widać po początkowych cenach jest tak w rzeczywistości.

Kolejna generacja architektury superskalarnej ATI, to nie tylko znaczne usprawnienia wydajności poszczególnych bloków wykonawczych (zwielokrotnienie ich liczby) ale również likwidacja słabych punktów na drodze, którą pokonują dane w poszczególnych blokach.
Nowe układy RV770 zawierają już 160 jednostek SP, co w porównaniu do starszych układów (64) jest ilością ponad 2,5 krotnie większą.

Architektura USSA (Unified Superscalar Shader Architecture) / Terascale Engine

Znając wcześniejszą budowę "komórek" stream procesorowych z RV670, wiemy jednak doskonale, iż całościowo znajduje się ich tu znacznie więcej : (4+1)5 * 160 = 800! Nie dziwi zatem parametr teoretycznej wydajności chipa określany na poziomie 1-ego i więcej TeraFlopa. W nowo zaprojektowanym rdzeniu producent podzielił jednostki SIMD na klastry po 10 "rdzeni", z których każdy posiada po 80SPu.

jedna ze 160-ciu "komórek" zawierających (4+1) pojedynczych  SPu

ATI przebudowało także znaczną część rdzenia układu odpowiedzialną za efektywniejsze obliczenia arytmetyczno - logiczne wprowadzając, wzorem nvidii, dodatkowe 16KB bufory pamięci podręcznej (Local DataShare) dla każdego rdzenia SIMD, oraz (Global DataShare) do wymiany danych, alokacji i komunikacji pomiędzy 10 głównymi "rdzeniami" zawierającymi jednostki cieniujące SP. W strukturze obecnej architektury USSA (TeraScale Engine) znajduje się także 40 jednostek teksturujących (przypadających w liczbie po 4 na jeden z dziesięciu bloków SP), łącznie z dedykowanymi procesorami adresującymi TA.


schemat blokowy jednostki TU (Texture Unit)

Przebudowano także Render Back-Endy (RBE). Dzięki wsparciu dla funkcji "independent blending per  render target", oraz usprawnieniom w Z/Stencil (podwojenie możliwych do wykonania operacji na sekundę) uzyskano znacząco lepszą wydajność trybów MSAA.

schemat blokowy RBE (Render Back-End)

Double Precision (FP64) - podobnie jak ma to miejsce w nowym układzie nvidii (GT200), RV770 posiada zdolność do wykonywania instrukcji zmiennoprzecinkowych o podwójnej precyzji (FP64). Mogą one zostać wykorzystane przy obliczeniach wymagających wysokiej dokładności wyników (zastosowania dedykowane do tej pory CPU). ATi szacuje wydajność w trybie 64-bitowej precyzji na 240GFlopów, co jest wartością dwukrotnie wyższą od możliwej do uzyskania na chipie konkurencyjnej nvidii (GT200). Double Precision, zgodne z normą IEE 754, jest także porównywalne wydajnościowo z zastosowaniem 5-iu czterordzeniowych procesorów x86.

256-bitowy kontroler pamięci potrafi wykorzystać nie tylko moduły GDDR3 zasilane napięciem 2.0V, ale również najnowszy standard GDDR5 (moduły zasilane napięciem 1.5V) o wysokiej częstotliwości pracy. Co bardzo istotne nowe kości nie potrzebują już stosowania skomplikowanego układu ścieżek na PCB, stąd zmniejszają się tu koszty projektowania oraz produkcji gotowej płytki.

UVD2 - Universal Video Decoder, został usprawniony o możliwość sprzętowych transformacji materiału video wysokiej rozdzielczości (HD) jednocześnie na dwóch źródłach. Daje to możliwość realnego wykorzystania funkcji takich jak m.in. "obraz w obrazie" (P-I-P).



odsłon: 77312

Ostatnie komentarze do artykułu

BaMpEr

2008-07-25 21:24:21

Trochu zabawy w plku .xml od sterownikow i mamy wydajny wentylator ... , zmieniamy wartosci na manual + ustawiamy np. predkosc w % na 65% temp spada w idlu do 45C - slychac lekki swist) stres ? 69C ... ^^ , jesli chodzi o OC , wykrecilem tego...

Loozak

2008-07-11 10:39:20

Na tą chwile jeśli chcesz pograć w wysokiej rozdzielczości to się żaden z tych Crossów nie opłaca, trzeba czekać na wersje z 1GB pamięci i wtedy będzie sens. Cross na te karty to do 1600x1200 jest super sprawa powyżej tego (jak u mnie nie...

Sebastian Swarcewicz

2008-07-10 20:30:35

Artykulik podrzucę jutro. Dostałem dwie karty HD4870, a przez to, że są to referenty wypadało by przedstawić obydwie. Oprócz HD4870 będą także wyniki CrossFire HD4850, a więc i odpowiedź na Twoje pytanie. W międzyczasie "dopieszczam"...

zobacz wszystkie komentarze (9)

skomentuj artykuł

Polecamy

Konsole przenośne - jaką wybrać
Jeśli lubisz mobilną rozrywkę, konsola przenośna zapewni więcej frajdy ...
kategoria: konsole do gier producent: Sony Ocena: 9 57
AMD Llano - do czego nadaje się APU?
Sprawdzamy w działaniu większość modeli APU AMD, w tym topowy model ...
kategoria: procesory producent: AMD Ocena: 27 68
XFX Radeon HD 7970 BE Double Dissipation - test i cena
Testujemy autorską kartę XFX Radeon HD 7970, która została fabrycznie ...
kategoria: karty graficzne producent: XFX Ocena: 22 72
Lenovo IdeaPad U300s - test, cena i opinie
Podpowiadamy na co zwrócić uwagę przy zakupie ultrabooka oraz testujemy ...
kategoria: laptopy producent: Lenovo Ocena: - 22
Motorola RAZR - test, cena i opinie
RAZR ma 4,3-calowy ekran Super AMOLED i jest jednym z najcieńszych smartfonów ...
kategoria: smartfony, telefony producent: Motorola Ocena: 12 54