Karty graficzne

Nvidia Ampere już jest! "Zieloni" zaprezentowali kartę graficzną nowej generacji

z dnia
Paweł Maziarz | Redaktor serwisu benchmark.pl
40 komentarzy Dyskutuj z nami

Oto jest! Podczas wirtualnej konferencji GTC 2020, Nvidia zaprezentowała A100, a więc pierwszą kartę graficzną z nowej generacji Ampere. Specyfikacja akceleratora wgniata w podłogę, aczkolwiek jest to układ do profesjonalnych zastosowań.

No właśnie, Nvidia póki co skupiła się na segmencie profesjonalnym, gdzie procesory graficzne są stosowane w wysokowydajnych systemach obliczeniowych. Można jednak podejrzewać, że układy z generacji Ampere w późniejszym terminie pojawią się też w kartach graficznych dla graczy.

Nvidia prezentuje topowy układ graficzny z generacji Ampere

Szef Nvidii ujawnił popisowe dzieło „zielonych”. Mowa o układzie Ampere GA100, który jest najbardziej złożonym układem graficznym zaprojektowanym przez inżynierów Nvidii - konstrukcja składa się z ponad 54 miliardów tranzystorów i ma powierzchnię 826 mm2 (do produkcji wykorzystano 7-nanometrowy proces technologiczny TSMC).

Nvidia Ampere GA100

Nvidia Ampere GA100 - Tensor

Nvidia Ampere GA100 - Tensor

Nvidia Ampere GA100 - Tensor

Specyfikacja układu wgniata w podłogę. Ampere GA100 składa się z 128 bloków SM – łącznie znajdziemy tutaj 8196 rdzeni CUDA i 512 ulepszonych rdzeni Tensor 3. generacji (producent nic nie wspomina o jednostkach RT, więc konstrukcja najprawdopodobniej została ich pozbawiona). Układ ma również do dyspozycji 48 GB pamięci HBM2 6144-bit.

Nvidia A100 - pierwsza karta graficzna Ampere już jest

Rdzeń Ampere GA100 znalazł zastosowanie w karcie A100 (chociaż bardziej prawdopodobne wydaje się tutaj określenie akcelerator obliczeniowy). Warto jednak zauważyć, że zastosowano tutaj okrojoną wersję rdzenia - dysponuje ona „tylko” 108 blokami SM, które przekładają się na 6912 rdzeni CUDA i 432 rdzeni Tensor (moc obliczeniowa pojedynczej precyzji dochodzi do 19,5 TFLOPS, a w przypadku dla rdzeni tensor jest to 312 TFLOPS FP16 i 624 TOPS INT8). Oprócz tego udostępniono 40 GB pamięci HBM2 5120-bit o przepustowości 1,6 TB/s.

Model Nvidia Tesla V100 Nvidia A100
Generacja Volta (12 nm) Ampere (7 nm)
Tranzystory 21,1 mld 54,2 mld
Powierzchnia 815 mm2 826 mm2
Rdzenie CUDA FP32/FP64 5376/2688 6912/3456
Rdzenie tensor 672 432
Moc obliczeniowa FP32/FP64 15,7/7,8 TFLOPS 19,5/9,7 TFLOPS
Moc obliczeniowa Tensor FP16 125 TFLOPS 312 TFLOPS
Moc obliczeniowa Tensor INT8 62 TOPS 624 TOPS
Pamięć VRAM 32 GB HBM2 4096-bit 40 GB HBM2 5120-bit
Przepustowość pamięci 900 GB\s 1,6 TB/s
TDP 300 W 400 W

Wydajność karty i tak robi wrażenie – poniżej znajdziecie porównanie A100 do karty Tesla V100 (model z 2017 roku z generacji Volta).

Nvidia Ampere GA100 - Tensor

Ciekawostką jest technologia Multi-instance GPU, która pozwala podzielić kartę A100 na siedem oddzielnych instancji, zajmujących się innymi zadaniami. Każda instancja ma swoje rdzenie CUDA, rdzenie tensor, pamięć podręczną i pamięć HBM2, co pozwala zapobiegać konfliktom między instancjami (można więc powiedzieć, że działają one jako osobne układy graficzne).

Nvidia Ampere GA100 - Tensor

Układy A100 oczywiście można też ze sobą łączyć. Producent zastosował 3. generację łącza NVLink, gdzie zwiększono przepustowość z 300 do 600 GB/s (przełączaniem kilku łączy zajmują się przełączniki NVSwitch o przepustowości 4,8 TB/s).

Nvidia prezentuje system obliczeniowy Nvidia DGX A100

Nvidia DGX-A100

Nvidia przy okazji zaprezentowała DGX A100, a więc swój nowy system obliczeniowy – konstrukcja została wyposażona w dwa 64-rdzeniowe procesory AMD Epyc „Rome”, osiem akceleratorów obliczeniowych A100 oraz 15 TB pamięci masowej pod PCI-Express 4.0. Producent chwali się, że to najbardziej zaawansowany system obliczeniowy AI.

Jeżeli bylibyście zainteresowani, system podobno jest dostępny od ręki - jego koszt to „jedyne” 199 000 dolarów.

Źródło: Nvidia, ComputerBase, VideoCardz

Zobacz więcej newsów o kartach graficznych:

Komentarze

40
Zaloguj się, aby skomentować
avatar
Dodaj
Komentowanie dostępne jest tylko dla zarejestrowanych użytkowników serwisu.
  • avatar
    KENJI512
    Rozwalili, jak AMD Intela :D A tak serio to czekam na konsumenckie 3080Ti, bo na to na pewno nie będzie mnie stać w tym żywocie :D
    13
  • avatar
    leon-san
    TDP to 300 W i 400 W.
    W tym tempie to za 5 lat będę potrzebować 3-fazowego zasilania do kompa.
  • avatar
    Faflucy
    Paweł, popraw tabelkę, bo przepustowość pamięci zamieniłeś.
  • avatar
    AmigaPPC
    Pięknego kopy w 4 litery zaliczył intel od nV :)
  • avatar
    Kapitan Nocz
    "Nvidia zaprezentowała A100, a więc pierwszą kartę graficzną z nowej generacji Ampere"

    Chciał bym zauważyć, że zaprezentowany układ w najmniejszym stopniu nie jest "kartą graficzną", dziennikarstwo ma jeszcze jakąś wartość merytoryczną? Na karty graficzne od Nvidi z architekturą Ampere trzeba będzie jeszcze poczekać, to co zaprezentowano z kartą graficzną ma tyle wspólnego, że wygląda jak układ graficzny w rzeczywistości jest to specjalizowana konstrukcja do obliczeń. Ciężko dziś o połapanie się co jest czym.
  • avatar
    Faflucy
    Tesla P100 posiada 3584 rdzenie CUDA tyle samo ma 1080Ti, jeżeli taka sama sytuacja będzie w obecnej generacji to 3080Ti powinien mieć 6912 rdzenie CUDA, to był by niezły potworek.
  • avatar
    BorniPL
    Przepustowość pamięci 1,6 TB/s 900 GB\s

    Nie powinno być odwrotnie?
  • avatar
    BariGT
    No to już wiecie jaką karty RTX5080Ti będą miały specyfikację aby gry AAA chodziły z RT :D
  • avatar
    benzene
    O 1/3 zmniejszyli ilość rdzeni Tensor a moc obliczeniowa wystrzeliła w kosmos. Dziwne to bardzo.
  • avatar
    Gatts-25
    Sytuacja Intela została pięknie przekazana przez USA po tym jak TSMC podpisało z nimi umowę na wybudowanie fabryki produkującej układy w 5nm , która ma zacząć działać na przełomie 2023 a 2024 roku.Dla Nvidia jest tyle gorzej , że AMD ma gotowe rozwiązania a już teraz wydali nową aplikację ProRender 2.0 gdzie CPU i GPU pracują razem przy renderingu.Okazuje się , że połączenie TR 3990X + Radeon VII Pro skutkuje przyśpieszeniem renderingu o 95%. Rendering za pomocą samego GPU zajmował prawie o 100% dłuższy czas i wynosiło to mniej więcej jak 1180ms przeciwko 2240ms z samym GPU.
    Czyli jednak można wykorzystać CPU? Można i takie same podejście widzę w grach nowej generacji.
    Nvidia szkoda trochę bo oni nie mają swojego CPU więc przyszłościowo są na gorszej pozycji od AMD zaś Intel po ostatnich rewelacjach z TSMC i podpisaniu umowy z USA pokazuje , że u nich z procesami produkcji nie jest ciekawie i będzie tylko gorzej.
  • avatar
    Erikson83
    Jak to jest karta graficzna, To se kupcie taką karte graficzną...
  • avatar
    kitamo
    Pojdzie na tym Crysis Remastered? :D

    19Tflop/9Tflop
    A moc samych tensorów to kosmos. Ładny postęp.
    niezle, robi wrażenie.
  • avatar
    markoos
    Wygląda to dobrze, trzeba poczekać na testy w praktyce.