Karty graficzne

Ray Tracing + Optix

z dnia 2010-03-26

Po Terascale2 znanego z Radonów serii HD 5000, Fermi jest kolejną architekturą skierowaną na rynek konsumencki, która oferuje wystarczającą wydajność do poradzenia sobie z Ray-Tracingiem w czasie rzeczywistym. Na czym polega technika ray-tracingu? Jest to inaczej śledzenie biegu promienia światła przebiegającego przez wyrenderowaną uprzednio scenę przestrzenną. Umożliwia generowanie realistycznych efektów, niejednokrotnie bardzo bliskich fotorealizmowi.

Jako że promienie światła rozchodzą się w mało przewidzianych kierunkach, od GPU wymaga to ogromnego nakładu pracy. W szczególności szybkiego tzw. swobodnego dostępu (random access) do zunifikowanej pamięci. Tradycyjna metoda renderingu natomiast - liniowego (linear block access).



Już w założeniu układ GF100 został zbudowany jako rdzeń potrafiący poradzić sobie z zaawansowanymi algorytmami ray-tracingu. Obecnie jest on także pierwszym układem, który ma możliwość sprzętowej rekursji (a więc powrotów i odwołań do tych samych algorytmów), przy jednoczesnym wykonywaniu innych obliczeń wykonywanych na grafice.

Dużą rolę w efektywności działania GPU, przy tak dużym obciążeniu, odgrywają również pamięci podręczne L1 oraz L2, w szczególności szybkość dostępu do bardzo małych porcji danych. Cache L1 alokuje i podtrzymuje dane w obszarze pamięci dla sąsiadujących promieni, podczas gdy L2 zwiększa przepustowość bufora ramki (framebuffer bandwidth amplifies).

Nowy układ, oprócz standardowych metod ray-tracingu, obsługuje także technologię NVIDIA Optix, czyli ray-tracing z użyciem algorytmów 'advanced global illumination' - takich jak 'path tracing' (śledzenie ścieżek promieni). Do zebrania informacji o statusie oświetlenia 'ambient lightning' w danym momencie na scenie wymaga to użycia znacznie większej liczby zmiennych pobieranych już dla całego zespołu promieni.



Path tracing według producenta powinien okazać się około czterokrotnie szybszy w stosunku do tej samej techniki zastosowanej na GT200.



Dzięki wysokiej wydajności w obliczeniach GPGPU (Computation), nowy układ powinien znacznie lepiej poradzić sobie z zaawansowaną fizyką. Możliwość wykonania znacznie bardziej skomplikowanych algorytmów pozwala na zaprzężenie układu za pośrednictwem PhysX-a bądź OpenCL do bardziej realistycznej symulacji zachowania płynów, w tym stworzenie interaktywnego środowiska o wysokiej hydrodynamice – smoothed particle hydrodynamics (SPH).