Nvidia Tesla V100 - topowy akcelerator obliczeniowy również w wersji pod PCIe

Tesla V100 to najpotężniejszy akcelerator obliczeniowy, który przyspieszy rozwój obliczeń wysokiej wydajności oraz sztucznej inteligencji.

Image
Paweł Maziarz

Miesiąc temu Nvidia zaprezentowała kartę graficzną Tesla V100, a więc pierwszy akcelerator z nowej generacji Volta – wtedy jeszcze jako karta typu Mezzanine (SXM2). Teraz w ofercie producenta pojawiła się jej wersja pod standardowe złącze PCI-Express x16.

Tesla V100 PCIe również wykorzystuje układ graficzny Volta GV100 z 5120 procesorami strumieniowymi i 640 rdzeniami tensor oraz 16 GB pamięci HBM2 4096-bit. Zmieniło się natomiast taktowanie rdzenia, bo pracuje on maksymalnie z częstotliwością około 1370 MHz (w wersji SXM2 jest to 1455 MHz).

Nvidia Volta GV100 - diagram
Rdzeń Volta GV100 składa się z 80 bloków SM, które łącznie dają 5120 procesorów strumieniowych. Nowością jest natomiast 640 jednostek tensor core, które są wykorzystywane do uczenia maszynowego i budowy sieci neuronowych

Mimo zmian w zegarach, karta oferuje podobną moc obliczeniową – 28 TFLOPS połowicznej precyzji, 14 TFLOPS pojedynczej precyzji i 7 TFLOP Spodwójnej precyzji (w wersji SXM2 jest to odpowiednio 30, 15 i 7,5 TFLOPS). Moc obliczeniowa przy głębokim uczeniu to z kolei 112 zamiast 120 TFLOPS. Przepustowość pamięci pozostała bez zmian i wynosi aż 900 GB/s.

Tesla V100 PCIe wykorzystuje interfejs PCI-Express 3.0 x16, więc przy połączeniu kilku kart przepustowość wynosi „tylko” 32 GB/s (w wersji SXM2 można wykorzystać magistralę NVLink o przepustowości 300 GB/s). Niższe zegary wpłynęły jednak na niższy pobór energii elektrycznej, bowiem współczynnik TDP wynosi już tylko 250 zamiast 300 W.

Model Tesla P100 (SXM2) Tesla P100 (PCIe) Tesla V100 (SXM2) Tesla V100 (PCIe)
Generacja Nvidia Pascal Nvidia Pascal Nvidia Volta Nvidia Volta
Litografia TSMC 16 nm
FinFET
TSMC 16 nm
FinFET
TSMC 12nm
FFN
TSMC 12nm
FFN
Powierzchnia rdzenia 610 mm2 610 mm2 815 mm2 815 mm2
Układ graficzny Pascal GP100 Pascal GP100 Volta GV100 Volta GV100
Taktowanie rdzenia 1480 MHz 1300 MHz 1455 MHz ~1370 MHz
Moc obliczeniowa FP16 21,2 TFLOPS 18,7 TFLOPS 30 TFLOPS 28 TFLOPS
Moc obliczeniowa FP32 10,6 TFLOPS 9,3 TFLOPS 15 TFLOPS 14 TFLOPS
Moc obliczeniowa FP64 5,3 TFLOPS 4,7 TFLOPS 7,5 TFLOPS 7 TFLOPS
Moc obliczeniowa tensor
(Deep Learning
- - 120 TFLOPS 112 TFLOPS
Pamięć wideo 16 GB HBM2 4096-bit 16 GB HBM2 4096-bit 16 GB HBM2 4096-bit 16 GB HBM2 4096-bit
Przepustowość pamięci 720 GB/s 720 GB/s 900 GB/s 900 GB/s
Typ karty Mezzanine (SXM2) PCIe 3.0 x16 Mezzanine (SXM2) PCIe 3.0 x16
Chłodzenie pasywne pasywne pasywne pasywne
TDP 300 W 250 W 300 W 250 W

Karta Tesla V100 PCIe ma być dostępna jeszcze w tym roku - zarówno w ofercie Nvidii, jak i gotowych systemach firm partnerskich (Hewlett Packard Enterprise przykładowo zapowiedział trzy systemy bazujące na tej konstrukcji).

Źródło: Nvidia, AnandTech

Wybrane dla Ciebie
ZACZEKAJ! ZOBACZ, CO TERAZ JEST NA TOPIE