Karty graficzne

Karty Nvidia Tesla P4 i P40 do akceleracji głębokiego uczenia

przeczytasz w 2 min.

Nowa generacja akceleratorów Nvidia Tesla oferuje jeszcze lepszą wydajność przy zachowaniu takiego samego poboru energii elektrycznej.

Nvidia zaprezentowała akceleratory obliczeniowe Tesla P4 i Tesla P40, które sprawdzą się w systemach głębokiego uczenia (deep learning). Nowa architektura Pascal pozwala tutaj uzyskać jeszcze lepszą wydajność i wyższą efektywność energetyczną względem modeli z poprzedniej generacji Maxwell.

Nowoczesne usługi oparte o sztuczną inteligencje (AI) sprawdzą się w różnych zastosowaniach – począwszy od asystentów aktywowanych głosem, przez filtry antyspamowe dla skrzynek email, a kończąc na silnikach rekomendacji filmów i produktów. Problem jednak w tym, że technologia ta obecnie opiera się głównie na procesorach centralnych (CPU), które nie są w stanie zapewnić odpowiedniej wydajności. Rozwiązaniem tego problemu okazują się akceleratory obliczeniowe, takie właśnie jak Nvidia Tesla – jakiś czas temu producent wprowadził do oferty swój topowy model Tesla P100, a podczas konferencji GPU Technology Conference 2016 zaprezentował słabsze modele Tesla P4 i Tesla P40.

Nvidia Tesla P4

Tesla P4 ma postać niskoprofilowej karty rozszerzeń, więc sprawdzi się w mniejszych serwerach – konstrukcja ta oferuje wydajność zbliżoną do 13 standardowych procesorów, a przy tym charakteryzuje się 40-krotnie wyższą efektywnością energetyczną. Na pokładzie znalazł się układ graficzny Pascal z 2560 rdzeniami CUDA oraz 8 GB pamięci o przepustowości 192 GB/s, a pobór mocy wynosi tutaj nawet 50 W (maksymalnie 75 W).

Nvidia Tesla P40

Tesla P40 to już znacznie wydajniejsza konstrukcja, bo oferuje wydajność porównywalną do 140 standardowych procesorów – zakładając, że każdy z nich kosztuje 5000 dolarów, nabywca może liczyć na oszczędność rzędu 650 000 dolarów. Karta bazuje na układzie graficznym Pascal z 3840 rdzeniami CUDA i ma do dyspozycji 24 GB pamięci o przepustowości 346 GB/s. Pobór mocy oszacowano na 250 W.

ModelTesla M4Tesla P4Tesla M40Tesla P40
Układ graficznyMaxwell GM206Pascal GP104Maxwell GM200Pascal GP102
Rdzenie CUDA1024256030723840
Taktowanie872/1072 MHz810/1063 MHz948/1114 MHz1303/1531 MHz
Moc obliczeniowa2,2 TFLOPS5,5 TFLOPS7 TFLOPS12 TFLOPS
Pamięć wideo4 GB GDDR5 128-bit8 GB GDDR5 256-bit12/24 GB GDDR5 384-bit24 GB GDDR5 384-bit
Taktowanie pamięci5500 MHz6000 MHz6000 MHz7200 MHz
Przepustowość pamięci88 GB/s192 GB/s288 GB/s346 GB/s
TDP50-75 W50-75 W250 W250 W

Przy okazji prezentacji nowych akceleratorów udostępniono nowe biblioteki Nvidia TensorRT i Nvidia DeepStream SDK, które wspomagają i optymalizują zadania związane z systemami głębokiego uczenia.

Nvidia TensorRT

Nvidia DeepStrema SDK

Gotowe serwery z kartami Tesla P4 i P40 będą dostępne u partnerów OEM i ODM odpowiednio od listopada i października tego roku.

Źródło: Nvidia, AnandTech

Komentarze

13
Zaloguj się, aby skomentować
avatar
Komentowanie dostępne jest tylko dla zarejestrowanych użytkowników serwisu.
  • avatar
    kokosnh
    3
    A ja czekam na kanapkę na 2 rdzeniach GP100 + HBM2, aby popatrzyć jak zamiata wszystko na rynku
    Ba może nawet będzie nowy titan z ( co by pozamiatał wszystko w grach )
    • avatar
      Dudi4Fr
      1
      Tesla P40 : Rdzenie CUDA -> 3840

      Czyli możemy się spodziewać Tytana XP Black? Albo obecny tytan XP to rdzeń który powinien być w 1080Ti a ten z 3840 CUDA znaleźć się w Tytanie XP?
      • avatar
        mr_rzeznik
        -1
        Ciekawe jak szybko kopie waluty ;)
        • avatar
          apuk666
          -1
          Pójdzie na tym crysis?
          • avatar
            mathfan
            -2
            Według mnie bardziej adekwatny opis w tytule to "... uczenia głębokiego" na nie głębokiego uczenia.