Karty graficzne

ATi Stream

Kolejna odsłona architektury superskalarnej jeszcze bardziej rozszerzyła możliwości jednostek procesorów strumieniowych w sferze obliczeń równoległych. Przede wszystkim nowa architektura pozwala na znaczne skrócenie czasu obliczeń o podwójnej precyzji FP64 (zgodnych z normą IEEE754).

Wydajność silnika Cypress w tym trybie oceniana jest na 544 GFlops – dla porównania potencjał chipa RV770 wynosi około 240GFlopsa. Jak na tym tle wypada NVIDIA z kartami serii Tesla? Model C1060 przy 64-bitowej precyzji zaoferuje zaledwie 78 GFlopsów, a taktowane zegarem 1,2GHz dwa układy GT200b „jedynie” 150 GFlopsów. Jednak różnice w architekturach jednostek SP obydwu producentów są znaczące, dlatego ocena teoretycznych możliwości obliczeniowych zależy w dużej mierze od wsparcia ze strony oprogramowania oraz samego środowiska.

Potencjał jest tu kilkukrotnie większy od potencjału przeciętnego czetordzeniowego procesora. W przypadku HD5870 - nawet dziesięciokrotnie.


architektura klastrów SIMD w układzie Cypress

Analizując wydarzenia z ostatnich kilkunastu miesięcy trzeba przyznać, że pierwsze rozdanie kart na tym polu należało do NVIDII - dopracowana architektura deweloperska CUDA oraz wsparcie dla realistycznej fizyki PhysX.

AMD zabierało się za ten typ użytkowania układów graficznych. Do dziś nie doczekaliśmy się jeszcze sprzętowego wsparcia dla modelu fizyki Havok, a odpowiedź na CUDA musiała czekać niemalże do momentu ukazania się API DirectCompute11 oraz OpenCL.

Wraz z pojawieniem się nowych kart, wspierających domyślnie model cieniowania SM5.0, producent zamierza położyć znacznie większy nacisk na szersze wykorzystanie potencjału swoich układów w obliczeniach typu Compute. Już dziś na rynku znajdziemy flagowe aplikacje CyberLinka, m.in. MediaShow oraz PowerProducer, potrafiące wykorzystać moc procesora graficznego ATi do sprzętowej akceleracji efektów, kodowania materiału czy dopalania aplikacji przy pracy wielomonitorowej.

To na pewno duży krok naprzód tego producenta układów. Niemniej jednak pewien przedsmak możliwości obliczeniowych silnika GPU ATI/AMD mogliśmy już podziwiać w popularnej aplikacji do obliczeń rozproszonych - Folding@home (procesy zwijania białek). Oprócz najnowszych kart ATi z serii HD aplikacja jest również wspierana przez procesory Cell (notabene wyprodukowane przez koncern ATi/AMD dla konsoli PlayStation 3).


DirectX11 Multi-Threading
– aplikacje, biblioteki uruchomieniowe DX oraz drivery wspierające to API,
mogą działać na odrębnych procesach – wielowątkowość Fusion

W odróżnieniu od procesorów GPU NVIDII, karty Radeon są w stanie dzielić zadania pomiędzy siebie a procesor centralny. Technologia ta nazwana została Fusion i podlega ciągłym ulepszeniom. Co ważne, premiera nowych kart, a także nowego środowiska API, umożliwi lepsze wykorzystanie tej zbalansowanej pomiędzy CPU a GPU techniki w środowisku wielowątkowym.

Z największą niecierpliwością czekamy na wsparcie przez Radeony sprzętowego przetwarzania kolizji map, nazywanego popularnie silnikiem fizyki. Już w momencie premiery serii HD4800 głośno mówiło się o Havok i możliwościach jakie za sobą niesie wsparcie dla tego modelu. Wraz z premierą serii HD5800 otrzymujemy kolejne obietnice i nadzieje związane z tzw. otwartą fizyką (otwarte standardy przetwarzania), w skład której wchodzi Havok, Bullet Physics oraz Pixelux Entertainment.

Nie bez znaczenia pozostaje także sprawa możliwości, jakie niesie za sobą DirectCompute w wersji 11. Już niebawem premierowe tytuły gier, takie jak S.T.A.L.K.E.R.: Call of Pripyat, DiRT 2 czy Aliens vs Predator będą wspierać fizykę oraz AI właśnie poprzez to API.