Karty graficzne

AMD wprowadza najwydajniejszą kartę graficzną dla superkomputerów - osiągi robią wrażenie

przeczytasz w 2 min.

Firma AMD pochwaliła się najszybszym akceleratorem do badań naukowych - model Instinct MI100 to pierwszy układ do serwerów z procesorami x86, który przekroczył barierę 10 TFLOPS w obliczeniach FP64. Nowa konstrukcja pozwoli przyspieszyć wdrażanie eksaskalarnych superkomputerów.

Premiera karty graficznej AMD Instinct MI100

Instinct MI100 to pierwsza karta graficzna na bazie nowej architektury CDNA. Specyfikacja pokrywa się z wcześniejszymi przeciekami (producent porzucił dopisek Radeon) - zastosowany układ korzysta ze 120 jednostek obliczeniowych CU, które przekładają się na 7680 procesorów strumieniowych. Oprócz tego przewidziano 32 GB pamięci HBM2 ECC o taktowaniu 1200 MHz.

AMD Instinct MI100 - schemat
Zastosowany układ wykonano w 7-nanometrowej litografii

Nowa architektura wprowadza też nową technologię Matrix Core, która zwiększa wydajność w pełnym spektrum operacji o jednej lub mieszanej precyzji, jak FP32, FP16, bFloat16, Int8 czy Int4. Rozwiązanie ma istotne znaczenie w przypadku wysokowydajnych systemów obliczeniowych (HPC) oraz systemów wspomagania sztucznej inteligencji (AI).

ModelAMD Radeon Instinct MI50AMD Radeon Instinct MI60AMD Instinct MI100
ArchitekturaGCN (TSMC 7 nm)GCN (TSMC 7 nm)CDNA (TSMC 7 nm)
Układ graficznyVega 20 GLXTVega 20 GL     MI100 XL 
Procesory strumieniowe384040967680
Taktowanie GPU1200-1746 MHz1200-1800 MHzdo 1502 MHz
Moc obliczeniowa FP1626,8 TFLOPS29,5 TFLOPS184,6 TFLOPS
Moc obliczeniowa FP3213,4 TFLOPS14,7 TFLOPS23,1 TFLOPS
Moc obliczeniowa FP646,7 TFLOPS7,4 TFLOPS11,5 TFLOPS
Moc obliczeniowa INT4107 TOPS118 TOPS184,6 TOPS
Moc obliczeniowa INT853,6 TOPS59,TOPS184,6 TOPS
Pamięć wideo16 GB HBM2 4096-bit32 GB HBM2 4096-bit32 GB HBM2 4096-bit
Przepustowość pamięci wideo1 TB/s1 TB/s1,23 TB/s
TBP300 W300 W300 W

AMD Instinct MI100

Wydajność karty AMD Instinct MI100

Wydajność? Suche dane wyglądają imponująco - karta osiąga 11,5 TFLOPS szczytowej mocy w obliczeniach FP64 i 23,1 TFLOPS szczytowej mocy w obliczeniach FP32. Zastosowana pamięć zapewnia 1,23 TB/s przepustowości i tym samym pozwala wyeliminować przestoje wynikające z przenoszenia danych do i z pamięci.

AMD Instinct MI100

Warto dodać, że AMD Instinct MI100 obsługuje technologię Infinity Fabric 2. generacji, co przekłada się na 2-krotnie wyższą przepustowość I/O przez interfejs PCIe 4.0, czyli nawet 340 GB/s agregowanego ruchu na akcelerator z trzema łącznikami AMD Infinity Fabric. W jednym serwerze można zastosować dwa połączone zestawy z czterema kartami każdy, co pozwala uzyskiwać nawet 552 GB/s przepustowości przy współdzieleniu danych.

AMD Instinct MI100

Więcej o realnej wydajności może powiedzieć Bronson Messer, dyrektor naukowy Oak Ridge Leadership Computing Facility:

Otrzymaliśmy wczesny dostęp do akceleratora MI100 i wstępne wyniki są bardzo zachęcające. Zwykle widzieliśmy znaczny wzrost wydajności, nawet 2- - 3-krotny w porównaniu z innymi układami GPU

Kluczową kwestię odgrywa tutaj oprogramowanie deweloperskie AMD ROCm - to narzędzie open souce, które składa się z kompilatorów, interfejsów pgoramowania API i bibliotek. Nowa wersja oprogramowania (ROCm 4.0) została zoptymalizowana specjalnie pod kątem MI100, aby wykorzystać pełny potencjał nowych akceleratorów.

Systemy z kartami AMD Instinct MI100 niebawem pojawią się na rynku

AMD Instinct MI100 został wyceniony na 6400 dolarów. Dla porównania konkurencyjny model Nvidia A100 kosztuje od 9800 do 11 300 dolarów (według ofert ze sklepów, bo Nvidia nie podaje sugerowanej ceny akceleratora).

Według zapowiedzi producenta, karta AMD Instinct MI100 pojawi się w systemach wiodących partnerów OEM i ODM jeszcze przed końcem roku. Wiemy, że takie konstrukcje planuje wydać Dell, Gigabyte, HPE i Supermicro.

Źródło: AMD, ComputerBase

Zobacz więcej o kartach graficznych:

Komentarze

20
Zaloguj się, aby skomentować
avatar
Komentowanie dostępne jest tylko dla zarejestrowanych użytkowników serwisu.
  • avatar
    Kapitan Nocz
    14
    jeszcze jak ktoś nie czuje tematu co wnoszą takie akceleratory i ile znaczą dla obliczeń superkomputerowych to ten tekst od AMD dużo wyjaśnia.

    "AMD twierdzi, że MI100 rywalizuje z 6-megawatowym ASCI White, najszybszym superkomputerem na świecie w 2000 roku, który ważył 106 ton i zapewniał 12,3 TFLOPS wydajności. W przeciwieństwie do tego MI1000 obniża moc do 300 W, waży tylko 2,56 funta i dostarcza 11,5 TFLOPS wydajności."
    • avatar
      Ciekawski_
      8
      Robi wrażenie. AMD atakuje na wszystkich frontach. Nvidia i Intel w odwrocie? :)
      • avatar
        hex3n
        2
        Crysis na tym pójdzie? :)
        • avatar
          Kapitan Nocz
          1
          wow ale fachowe przedstawienie tematu, gdzie porównanie do głównego konkurenta od Nvidi lub starej starszej generacji od AMD, tylko cenę żeście znaleźli ?
          • avatar
            kitamo
            -11
            nie bardzo wiem co tu ma robic wrazenie.
            • avatar
              Witalis
              0
              Wreszcie jakaś rozsądna karta która pokaże co potrafi E8400 XD