Karty graficzne

Testy OpenCL i DirectCompute: Sandra 2010

przeczytasz w 2 min.

Wersja 2010 tego popularnego programu przyniosła kilka zmian, w tym między innymi uzupełniono dział benchmarka GPGPU Processing o test OpenCL. Sprawdźmy więc, która z kart będzie miała (podkreślamy: teoretycznie) większe możliwości obliczeniowe przy użyciu OpenCL.

Sandra 2010 – OpenCL Processor

 

 

Sandra po raz drugi i ponownie wielka przewaga kart ATI w teście Float. Wyniki testu Double Shaders są całkowicie odmienne – tu z kolei widać supremację układów NVIDII. GTX 480 osiąga o 50% lepszy wynik od Radeona HD 5870. Wszelkie znaki na niebie i ziemi (oraz informacje na stronie ATI/AMD) wskazują na to, że sterowniki OpenCL nie potrafią wykorzystać dwóch układów Radeona HD 5970. Znacznie bardziej dziwne jest to, że wyniki kart graficznych ATI wraz z procesorem są znacząco niższe od samej karty. Dlaczego się tak dzieje? Spróbujmy przeanalizować te wyniki pod kątem zajętości zasobów systemowych.

UkładŚrednie użycie GPU
Średnie użycie CPU
GT200
97%2%
GF100 (Fermi)
99%25%
Cypress + Deneb
50%50%
Cypress (58xx)
99%1%
Deneb (Phenom II X4)
n/d96%

Sytuacja od razu staje się jasna. Nic dziwnego, że karty graficzne ATI pracując razem z procesorem osiągają taki słaby wynik, skoro w tym teście pracują na „pół gwizdka”. Warto zauważyć, że Fermi (GF100) jako jedyna wśród kart graficznych w teście GPU zużywała też  1 / 4 mocy procesora.

 

Sandra 2010 – Compute Shader Processor

 

UkładŚrednie użycie GPU
Średnie użycie CPU
Cypress (58xx)
98%25%
GF100 (Fermi)
98%25%

Direct Compute bardzo demokratycznie podszedł do obu konkurencyjnych konstrukcji, obciążając je w identycznym stopniu. Rodzinka Evergreen jest jednak w tym teście wyraźnie lepsza, a najszybszy GF100 (GTX 480) nie radzi sobie z Radeonem 5830. Sprawia to, że obserwując wyniki testów Sandra ogarniają nas coraz większe wątpliwości.

 

Powyższy zrzut ekranowy przedstawia zajętość procesora podczas testu Compute Shader Processor (góra) i OpenCL Processor (dół) na kartach graficznych Fermi. W obu przypadkach procesor jest obciążony w okołu 25%, ale zajętość rdzeni jest zupełnie inna.