Pierścieniowy kontroler pamięci

13 listopada 2005przeczytasz w 2 min.

ATI wyposażył swoje nowe procesory graficzne w zupełnie nowy, przerobiony kontroler pamięci. Wewnętrzna szyna pamięci X1800 ma topologię pierścieniową i składa się z dwóch 256 bitowych dwukierunkowych szyn pierścieniowych, natomiast X1600 z dwóch 128 bitowych szyn dwukierunkowych.

Szyny pierścieniowe otaczają kość, pomagają upraszczać i optymalizować wzajemne łączenie. Dzięki temu składniki układu mogą być połączone w najkrótszy sposób. W połączeniu z jednostką wykonawczą, rozwiązanie to minimalizuje opóźnienia i zniekształcenia sygnału podczas operacji zapisywania pamięci. Dzięki technologii pierścieniowej Radeony X1800 i X1600 mogą współpracować z pamięciami o wysokiej częstotliwości takim jak np. GDDR4, podczas gdy tradycyjna architektura nie byłaby w stanie ich obsłużyć ze względu na nie najlepiej skonstruowane łączniki wewnątrz GPU.

Pamięć połączona jest z szyną w miejscu tak zwanych przystanków pierścieniowych (Ring Stops). Istnieją 4 takie miejsca, każde z nich ma dwa 32 bitowe kanały dostępu. Dla porównania, pamięć Radeona X850 łączy się z kontrolerem za pomocą 64 bitowych kanałów. Każdy punkt Ring Stop może podać dane klientowi według instrukcji kontrolera pamięci.

Podsystem Ring Bus pracuje w bardzo prosty sposób. Klient wysyła zapytanie o dane do kontrolera pamięci, który jest umieszczony w centrum układu. Kontroler pamięci korzysta ze specjalnego algorytmu, aby określić priorytet każdego zapytania, nadając najwyższy status tym zapytaniom, które mają największy wpływ na wydajność. Następnie przesyła odpowiednie zapytanie do pamięci i wysyła dane wzdłuż szyny pierścieniowej (Ring Bus) aż do przystanku (Ring Stop) najbliższego pytającemu klientowi. Z Ring Stop dane docierają do klienta. Tak zwany Write Crossbar Switch znajduje się wokół kontrolera odpowiedzialnego za optymalny dostęp do pamięci. Nadzoruje on równy rozdział zapytań.

Algorytm operacyjny nowego kontrolera może być programowany przez driver, tak więc w przyszłości jego funkcjonowanie może zostać usprawnione. Co więcej, ATI ma teoretyczną szansę programowania kontrolera pod kątem określonych aplikacji i tworzenia odpowiedniego profilu w sterownikach Catalyst.

Cache stał się w pełni asocjacyjny, tzn. dowolna linia cache może przechowywać zawartość dowolnej lokacji w pamięci zewnętrznej.

Przy zachowaniu tej samej częstotliwości, cache asocjacyjny pracuje o wiele wydajniej niż bezpośrednio mapowany (direct-mapped cache). W związku z tym, nowa architektura ma duży zapas wydajności względem aplikacji, dla których niezmiernie ważna jest przepustowość pamięci grafiki podsystemu. Innymi słowy, Radeon X1000 ma spisywać się świetnie przy wysokich rozdzielczościach i/lub przy włączonym pełnoekranowym wygładzaniu i anizotropowym filtrowaniu.

Również technologia HyperZ została poprawiona. Użyto bardziej wyszukanego algorytmu do identyfikowania niewidocznych powierzchni, które mają być usuwane. ATI twierdzi, że nowy algorytm jest o 50% bardziej wydajny niż ten z Radeona X850.

Zauważmy, że mimo iż RADEON X1300 nie obsługuje ani szyny pierścieniowej (Ring Bus) ani programowalnego arbitra zapytań pamięci, wykorzystuje on inne techniki zaprojektowane z myślą o poprawie przepustowości pamięci kart z rodziny RADEON X1000.

Witaj!