Karty graficzne

Radeon HD 7970 - architektura, nowości

opublikowano przez Kamil Myzia w dniu 2012-01-13

Najważniejsze fakty dotyczące architektury Radeona 7970:

  • Nowa struktura rdzenia GNC
  • 2048 procesorów strumieniowych
  • 128 jednostek teksturujących
  • 32 rasteryzujących
  • 4,3 mld tranzystorów w GPU
  • 3 GB pamięci 384 bit GDDR5
  • Interfejs PCI Expres 3.0 x16
  • Taktowanie: 925 MHz dla rdzenia, 1375 MHz dla pamięci

 

Blok GPU

Pamięć

GCN

Jednostka obliczeniowa GCN jest podzielona na szereg grup, z których każda zajmuje się określonymi zadaniami.

Jedną z największych różnic w porównaniu do starszej architektury widać już na samej górze diagramu, czyli podwójne silniki przetwarzania geometrii, które między innymi mają odpowiadać że teselację.

W dobie coraz bardziej wymagających gier i silnej konkurencji ze strony „zielonych”, AMD opracowało silnik graficzny GCN (Graphic Core Next). W jego skład wchodzą 32 jednostki Compute Units, gdzie na jedną CU przypadają 64 jednostki ALU (arytmetyczno-logiczne). Dla zachowania możliwie najwyższej wydajności przewidziano dodatkową pamięć L2 o pojemności 768 KB. Kolejną składową silnika graficznego HD 7970 jest osiem bloków RBE (Render Back-ends) zawierających 32 jednostki rasteryzujące i 128 jednostek Z/stencils.

Ewolucja

Zamieszczony powyżej diagram przedstawia rozwój silników graficznych w ciągu ok. 10 lat. Pierwsza era GPU (Graphics Processing Unit) z perspektywy obecnych czasów miała stosunkowo niewielki zakres możliwości. Nasi starsi użytkownicy powinni pamiętać czasy GeForce 256, który jako pierwszy sprzętowo obsługiwał transformację i oświetlenie. Prawdziwy rozwój miał miejsce kilka lat później, kiedy GPU miały już programowalne jednostki pixel i vertex shaders. W tamtym okresie rozpoczęła się era coraz ładniej wyglądających gier, których widoki często zapierały dech w piersiach. Technologia cały czas szła do przodu i w trzeciej erze otrzymaliśmy zunifikowane jednostki cieniujące. Przez ostatnie lata wszystkie generacje kart graficznych opierały się na podobnym schemacie.

AMD określa GCN jako kolejną strukturę budowy rdzeni graficznych potrafiących wykonywać skomplikowane obliczenia. Nie tylko te, które są wymagane do wygenerowania trójwymiarowego obrazu, ale i akceleracji App, którą wykorzystuje coraz większa liczba aplikacji.

GCN

Struktura VLIW4, z której korzystały najwyższe modele z serii Radeon HD 6000, sprawdziła się. Widać to zresztą po wydajności tych akceleratorów w grach. Niemniej jednak podstawowym ograniczeniem architektury VLIW4 jest to, że sprawdza się głównie w akceleracji grafiki. Silnik graficzny w HD 7970 (i w jego pochodnych) ma natomiast o wiele większe możliwości w zadaniach „nie graficznych”. Sprawdzi się w aplikacjach, które wymagają dużej mocy obliczeniowej, odciążając przy tym CPU. W tym kierunku AMD już poszło jakiś czas temu, oferując układ Brazos. Co więcej, z architektury GCN mają korzystać nie tylko topowe modele, ale i wszystkie pozostałe, jakie się pojawią pod nazwą HD 7000.

AMD planuje jeszcze przez długi czas oferować starsze karty, które korzystały z silnika o strukturze VLIW4 (HD 6900) i VLIW5 (HD 6800). Z architektury GCN mają korzystać nie tylko topowe modele, ale i wszystkie pozostałe, jakie się pojawią pod nazwą HD 7000.

Pamięć

AMD od czasu wprowadzenia akceleratorów Radeon 3800 oferowało w najlepszym przypadku pamięć o magistrali 256 bit. Nvidia i jej wydajniejsze modele GeForce potrafiły wykorzystać moduły pamięci 320, 384 lub nawet 512 bit. Wraz z rodziną kart graficznych Southern Islands AMD wprowadza magistralę 384 bit. W najwydajniejszym Tahiti zastosowano właśnie taką pamięć rozmieszczoną w sześciu 64-bitowych kontrolerach, o łącznej pojemności 3 GB. Radeon 7970 przy uwzględnieniu taktowania 1375 MHz może pochwalić się przepustowością rzędu 264 GB/s. Dla porównania, GeForce GTX 580 oferuje maksymalnie 192 GB/s, a Radeon 6970 – 176 GB/s.

Nowości, nowości

Technologie

AMD wraz z Southern Islands skupiło się na rozwoju lub wprowadzeniu kilku nowych technologii, które w największym skrócie zawiera powyższa lista. Są to przede wszystkim:

  • Zupełnie nowa architektura rdzenia graficznego: proces technologiczny 28 nm, obsługa PCI-Express 3.0, nowe funkcje zasilania układu w tym rewolucyjny AMD ZeroCore Power
  • Unowocześniona obsługa wielu monitorów: AMD wprowadza nowe funkcje do technologii Eyefinity
  • AMD App Acceleration: zespół technologii opracowanych w celu ulepszenia jakości wideo i zwiększenia wydajności aplikacji.

Teselacja

Teselacja

Teselacja

Jak dotąd wydajność Radeonów w teselacji, przynajmniej w  wyspecjalizowanych benchmarkach, ustępowała kartom GeForce, choć w grach wykorzystujących tą technologię różnice się zacierały. Wyjątkiem może być jednak Crysis 2 w trybie DirectX 11, który nawet na wydajnym Radeonie HD 6970 działał wyjątkowo przeciętnie. W sieci możemy znaleźć wiele porad jak poprawić ten stan, właśnie m.in. poprzez wyłączenie teselacji.

Unowocześniona architektura wprowadza nowy silnik, a co za tym idzie - lepsze właściwości Radeonów 7000 w grach z  tą technologią. AMD podaje, że wzrost wydajności w stosunku do HD 6900 może być nawet czterokrotny.

Partially Resident Textures

Partially Resident Textures

Partially Resident Textures

Nowość, z której w głównej mierze mogą skorzystać programiści. PRT polega nad lepszym zarządzaniu teksturami umieszczanymi w pamięci operacyjnej. Tekstury są dzielone w pamięci i można uzyskać do nich szybki dostęp (coś na wzór pamięci podręcznej). Wykorzystanie PRT pozwoli na mniejsze zapotrzebowanie pojemności pamięci i stosowanie tekstur o większej rozdzielczości. W rezultacie będziemy mogli zobaczyć gry o lepszej jakości tekstur.

AMD ZeroCore Power Technology

ZeroCore

AMD ZeroCore Power przyda się zwłaszcza tym, którzy odchodzą od komputera na dłuższy czas. To idealne rozwiązanie dla użytkowników gier Steam, gdzie czasami trzeba pobrać kilkanaście gigabajtów danych. ZeroCore aktywuje się w momencie przejścia monitora w stan czuwania. Wówczas karta graficzna może pobierać zaledwie 3 W. Przy okazji wentylator zatrzymuje się, nie wytwarzając przy tym żadnego hałasu. Sprawdziliśmy w  praktyce - funkcja działa bez zarzutu.

AMD App Acceleration

aplikacje

aplikacje

Producent rozwija właściwości akceleratorów graficznych, które mogą zostać użyte nie tylko do renderowania trójwymiarowego obrazu. AMD App Acceleration to zespół technologii opracowanych w celu ulepszenia jakości wideo i  zwiększenia wydajności aplikacji. Pełne wykorzystanie niektórych funkcji wymaga obsługi standardu OpenCL lub DirectCompute (łącznie z  uniwersalnym dekoderem wideo - Universal Video Decoder, UVD). Wymienić tu można chociażby takie programy jak Divx, Internet Explorer 9, Google Chrome, Mozilla Firefox, PowerPoint czy Corel WinDVD.

Eyefinity 2.0

Eyefinity 

Autorska technologia obsługi wielu monitorów cały czas jest rozwijana. Dodano m.in. opcję Task Bar Positioning, która pozwala na wyświetlenie środka pulpitu na dowolnym z monitorów w trybie Eyefinity. Oprócz tego jest możliwość połączenia z funkcją HD3D, która została zaprojektowana w celu umożliwienia stereoskopowej projekcji 3D podczas odtwarzania gier, filmów lub fotografii. Wymaga sterowników, okularów i monitora stereo 3D. Lista obsługiwanego sprzętu stereoskopowego 3D dostępna jest na stronie: http://www.amd.com/HD3D.

UVD

UVD

VCE 

W Radeonach z rodziny Southern Iislands rozszerzono możliwości dekodera UVD, który jest odpowiedzialny m.in. za dekodowanie materiału wideo w  wysokiej rozdzielczości. Usprawniono również silnik VCE (Video Core Engine) o kilka nowych funkcji.

DDM Audio

DDM Audio

Od teraz jest możliwe odtwarzanie dźwięku z trzech niezależnych źródeł. Przykładowo, po podłączeniu trzech monitorów możemy jednocześnie oglądać mecz, mieć włączoną grę i rozmawiać na skype. Dźwięk nie będzie na siebie nakładany.