Karty graficzne

Nvidia prezentuje DGX-1 - superkomputer z ośmioma kartami Tesla P100 za 129 tys. dol.

przeczytasz w 2 min.

Tesla P100 to najwydajniejsza karta graficzna do profesjonalnych zastosowań - jej moc obliczeniowa sięga 21,6 TFLOPS.

Na wczorajszej konferencji GPU Technology Conference 2016 poznaliśmy szczegóły odnośnie architektury nowej generacji procesorów graficznych Nvidia Pascal oraz topowego przedstawiciela Pascal GP100. To jednak nie koniec nowości, bo oprócz tego zaprezentowano pierwszą kartę graficzną wyposażoną w ten chip – mowa o modelu Tesla P100, który został zaprojektowany z myślą o uczeniu maszynowym (deep Learning), zastosowaniach naukowych, inżynieryjnych i wysokowydajnych obliczeniach (HPC).

Tesla P100 nie przypomina tradycyjnej karty rozszerzeń (bardziej trafne chyba wydaje się tutaj określenie moduł). Na pokładzie znalazł się procesor graficzny Pascal GP100, ale w nieco przyciętej wersji – do dyspozycji oddano bowiem 56 z 60 bloków SM, które przekładają się na 3540 rdzeni CUDA i 224 jednostki teksturujące. Oprócz tego udostępniono 16 GB pamięci HBM2 4096-bit z korekcją błędów Single-Error Correct Double-Error Detect. Cała konstrukcja charakteryzuje się współczynnikiem TDP na poziomie 300 W.

Nvidia Tesla P100 karta graficzna   Nvidia Tesla P100 karta graficzna
Tesla P100 nie przypomina tradycyjnej karty rozszerzeń

Karta graficznaTesla K40Tesla M40Tesla P100
GPUKepler GK110Maxwell GM200Pascal GP100
TechnologiaTSMC 28nmTSMC 28nmTSMC 16nm
Tranzystory7,1 mld8 mld15,3 mld
Powierzchnia GPU551 mm2601 mm2610 mm2
Bloki SM152456
Procesory strumieniowe288030723584
Jednostki teksturujące240192224
Taktowanie745/875 MHz948/1114 MHz1328/1480 MHz
Moc obliczeniowa FP641,43 TFLOPS0,21 TFLOPS5.30 TFLOPS
Moc obliczeniowa FP324,29 TFLOPS7 TFLOPS10,6 TFLOPS
Memory Interface12 GB GDDR5 384-bit24 GB GDDR5 384-bit16 GB HBM2 4096-bit
Przepustowość pamięci288 GB/s288 GB/s720 GB/s
TDP235 W250 W300 W

Nowa karta może pochwalić się mocą obliczeniową 21,2 TFLOPS połowicznej precyzji (FP16), 10,6 TFLOPS pojedynczej precyzji (FP32) i 5,3 TFLOPS podwójnej precyzji (FP64). Przepustowość pamięci wynosi natomiast 720 GB/s (szczytowo) – przy zastosowaniu CUDA 6 staje się ona pamięcią zunifikowaną i może z niej korzystać także procesor centralny (CPU).

Nvidia DGX-1 superkomputer

Nvidia DGX-1 - budowa

Przy okazji Nvidia zaprezentowała klaster obliczeniowy DGX-1, w którym zastosowano dwa procesory Intel Xeon E5-2698 v3, 512 GB pamięci DDR4-2133 LRDIMM, osiem modułów Tesla P100 (połączone za pomocą magistrali NVLink), cztery nośniki SSD 1,92 TB połączone w macierz RAID 0 oraz zasilacz U3 o mocy 3200 W. Oprócz tego producent udostępnił dwie karty sieciowe 10 GbE oraz cztery InfiniBand EDR 100 Gbps.

Nvidia DGX-1 - superkomputer
Superkomputer DGX-1 od środka - całość waży 61 kg (foto: ComputerBase)

Producent chwali się, że DGX-1 to pierwszy na świecie superkomputer do uczenia maszynowego. Konstrukcja ta oferuje moc obliczeniową sięgającą 170 TFLOPS, co można porównać do 250 tradycyjnych serwerów.

Nvidia DGX-1 - wydajność

Nvidia DGX-1 - wydajność

Nvidia DGX-1 w Stanach Zjednoczonych trafi do sprzedaży w czerwcu, niemniej jednak już teraz można składać zamówienia – cena to „jedyne” 129 000 dolarów. Wiadomo również, że firmy IBM, HP, Dell i Cray przygotowują autorskie konstrukcje z modułami Tesla P100 (ich dostępność spodziewana jest dopiero w pierwszym kwartale 2017 roku).

Na koniec jeszcze fragmenty wczorajszej konferencji poświęcone Tesli P100 i klastrowi DGX-1.

Źródło: Nvidia, ComputerBase

Komentarze

15
Zaloguj się, aby skomentować
avatar
Komentowanie dostępne jest tylko dla zarejestrowanych użytkowników serwisu.
  • avatar
    mjwhite
    6
    wow, skoro nagle rzucili na rynek komputer z 8mioma takimi kartami" to znaczy że uzysk chipa jest całkiem dobry szczególnie biorąc pod uwagę hmb2
    • avatar
      piccardo
      -5
      Jestem bardzo ciekaw jak będzie wyglądać wydajność w grach 4K skoro przepustowość i ilość pamięci jest tak mocno zwiększona względem poprzednika. Chociaż cieszyłbym się z FHD stałe 60 klatek ultra wszystko ON, bo jak na razie to i z tym ciężko dla jednej karty.
      • avatar
        passat
        -9
        Pójdzie na tym Crysis
        • avatar
          MrZiomHD
          -13
          Uwaga! Za chwilę napisze coś śmiesznego!
          Pójdzie na tym minecraft?
          • avatar
            scoobydoo19911
            0
            takie jedno złącze tej karty ma ma 2x 500 pinów, jestem ciekawy jak z wydajnością czegoś takiego będzie gdy zwykłe pci-e x16 ma raptem 164 piny a w zdecydowanej większości przypadków to wystarcza.
            • avatar
              kropak
              0
              Cena spoko biery tczy :D