Review – Nvidia Titan V – Enter the matrix

Scris de: , in categoria: Featured Articles, Placi video, in 2 February, 2018.

Arhitectura

 

 Nvidia Titan XpNvidia Titan V
Single precision12.1 TFLOPS13.8 TFLOPS
Double precision0.38 TFLOPS6.9 TFLOPS
Half precision0.19 TFLOPs27.6 TFLOPS
Deep learningn/a110 TFLOPS
Tensor coresn/a640

 

Desigur, poate viitorul nu va arata atat de sumbru… Din ce stim in momentul de fata, sunt mai mari sansele ca astfel de unelte sa fie utilizate pentru a descoperi leacuri pentru maladii incurabile, sau noi surse de energie. Un lucru insa este clar, prima implementare Volta pe care Nvidia au lansat-o pe piata nu a fost dedicata in intregime gaming-ului. Sau, mai bine zis… desi performantele in jocuri sunt probabil superioare oricarei placi video lansate pana in momentul de fata, ar fi o idee buna pentru gameri sa mai astepte cateva luni…

La o prima vedere, arhitectura Volta poate parea un die shrink pe 12nm pentru Pascal, cu aditia de nuclee Tensor, insa, in realitate lucrurile nu stau chiar asa. La nivel de organizare logica lucrurile sunt similare, uitandu-ne mai atent putem observa faptul ca NVIDIA au operat modificari la executia threadurilor, paralelizare, organizarea SM-urilor, controllerul de memorie si multe altele.

Noutatea absoluta consta in nucleele Tensor, mai putin flexibile din punct de vedere al programarii, dar extrem de puternice in aplicatii de calcul HPC. Rezultatele impresionante in ceea ce priveste capabilitatile de calcul de care dispune GV100 sunt in mare masura date de aceste nuclee Tensor. Fata de Pascal, Volta este de 4 ori mai rapida in procesare FP16 atunci cand nucleele Tensor sunt folosite, de regula in cazul retelelor neurale (training si interference). Avantajul simplitatii acestor nuclee este ca ocupa destul de putin spatiu pe pastila, iar NVIDIA a putut inghesui cate 8 pe fiecare SM (640 nuclee Tensor in total). Totusi, nucleele Tensor nu sunt utile la altceva in afara de algoritmi avansati de deep learning, prin urmare suportul software si optimizarea pentru ele trebuie realizate de catre dezvoltatori.

Nucleul GV100 este un behemoth in adevaratul sens al cuvantului, tinand cont ca discutam despre 815 mm2 si 21.1 miliarde de tranzistori. Obtinerea stabilitatii termice, respectiv obtinerea unui consum decent, au fost posibile prin trecerea la un proces de fabricatie pe 12nm FFN (urmasul lui 16nm FinFET) in fabricile TSMC. Varianta full a lui GV100 are 84 SM-uri, insa din conditii ce tin de yield, Titan V are activate doar 80. Fiecare SM contine 64 FP32 CUDA cores, 64 INT32 CUDA cores, 32 FP64 CUDA cores, 8 tensor cores si o cantitate semnificativa de cache. La un calcul simplu, Titan V este dotata cu 5120 FP32 CUDA cores si 640 Tensor cores.

Ca si in cazul lui GP100, GV100 foloseste memorie HBM2 conectata direct la GPU prin intermediul unui interposer. Nvidia Titan V vine cu 4 bancuri HBM2, insa, din motive de yield, controller defect, sau chiar memoriei in sine, doar 3 sunt functionale. Asta inseamna ca avem la dispozitie 12GB VRAM care ruleaza la 1.7GHz pentru o latime de banda totala de 653GB/s.

 

Comentarii

7 comentarii la: Review – Nvidia Titan V – Enter the matrix

    1. doru pop a scris pe:

      Woau…
      Frumoasa introducerea…
      Apoi de placa …ce sa mai … dupa citirea specificatiilor , am crezut cu emotie ca o sa vad diferente mult mai mari la jocuri … Nu ca n-ar fi puternica , “Dar nu este monstrul pe care il cauta majoritatea gamerilor”…

      Primavara -vara sigur deci ne asteptam la ceva frumos .

      Bravo nvidiei ca nu se opresc ( mai ales ca oricum nu mai are concurenta ) , acum daca noile placi ar veni si cu preturi pamantesti …ar fi super…( sa nu puna 1500 Euro pt noile placi ce vor urma in primavara )

    2. doru pop a scris pe:

      Cred ca la minerit asta face cel mai bine treaba πŸ™‚

    3. JJ.Nicolae a scris pe:

      Cu o pastila dublu fata de cele anterioare, cu viteze bune si inca umpic ciuntita (eu cred ca intentionat vezi SM-urile) e clar ca au lasat loc pentru mai bine.
      Buna pentru minerit, clar, dar si pretul pe masura. Iar cum asa incet incet gamingul pe PC va trece pe planul 2 in favoarea mineritului (din punct de vedere al GPU, parere personala). Chiar daca producatorii “ar dorii” sa nu fie asa, dintr-un anumit punct de vedere (fiabilitatea in timp a placilor), din alt punct de vedere ar prefera sa fie cererea mai mare decat productia (pana la urma castigurile sunt baza oricarei afaceri).
      Sunt curios versiunile din gama de mijloc cum vor arata, mai ales ca inca NVIDIA nu are un rival adevarat (poate pana la finele anului se va schimba si acest fapt).

    4. doru pop a scris pe:

      Cand nu mai ai concurenta …si vezi ca placa veche se vinde in draci la peste 1000 euro , ce motiv altul sa scoti alta mai buna, decat s-o pui la vanzare la pret si mai ssus, ai avea?

    5. teo a scris pe:

      Bine ca dupa atatea luni de cand a aparut v-ati trezit si voi sa faceti review.

    6. hizo a scris pe:

      ppentru ce va insemna sper cat mai curand aplicatiile care vor folosi capacitatile deep llearning, pretul, pt aceasta placa deschizatoare de drum, e deplin justificat…

    7. doru pop a scris pe:

      @teo ce inseamna la tine ” atatea luni” ca eu din cate stiu placa aceasta, nvidia doar in decembrie (acum 2 luni) au anuntat-o.

    Lasa-ne un comentariu: