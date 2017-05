Nvidia hat seine Antwort auf AMDs Vega-GPUs vorgestellt. Und dabei handelt es sich um ein echtes GPU-Biest...

Vergrößern Nvidia-Chef Jen-Hsun Huang stellt das erste Produkt mit Volta-GPU vor: Tesla V100 GPU. © Nvidia

Nvidia-Chef Jen-Hsun Huang hat während seiner Keynote auf der GPU Technology Conference mit der Tesla V100 GPU erstes Produkt vorgestellt, welches auf der Nvidia Volta GPU basiert. Nvidias Antwort auf die Vega-GPUs von AMD , die in einigen Wochen auf den Markt kommen sollen, fällt eindrucksvoll aus. Mit den Pascal-GPUs (wie etwa Nvidia Geforce GTX 1080 ) ist Nvidia zwar weiterhin gut aufgestellt, präsentiert aber schon jetzt einen Ausblick auf die nächste GPU-Generation.

Vergrößern Tesla V100 © Nvidia

Die schlechte Nachricht vorweg: Das erste Volta-GPU-Produkt, die Tesla V100, ist nur für den Einsatz in Datenzentren gedacht. Die Volta-GPU wird im 12-Nanometer-Verfahren hergestellt und damit in einem fortschrittlicheren Herstellungsverfahren als die Pascal-GPUs.

Die Tesla V100 besitzt insgesamt 21 Milliarden Transistoren und 5.120 CUDA-Kerne, die mit 1.455 Megahertz (Boost) getaktet sind.



Zum Vergleich: Das aktuelle Pascal-GPU-Flagschiff von Nvidia ist die Tesla P100, die im 14 Nanometer-Verfahren hergestellt wird, 15 Milliarden Transistoren und 3.840 CUDA-Kerne besitzt. Die GTX 1080 besitzt dagegen 2560 CUDA-Kerne und die GTX 1060 insgesamt 1.280 CUDA-Kerne.

Für die zusätzliche Leistung der Volta-GPU musste Nvidia die Größe des Chips von 600 mm² bei der Tesla P100 auf 815 mm² bei der Tesla V100 erhöhen. In dem Zusammenhang weist Huang auch darauf hin, dass mit der Volta-GPU die Fotolithografie, also die Methode zur Herstellung von Chips, an ihr Limit gelangt sei.



Vergrößern Blick in das Innere der Tesla V100 © Nvidia

Bei Volta hat Nvidia auch die Architektur der Streaming-Mikroprozessoren geändert. Im Ergebnis sei im Vergleich zu Pascal die Effizienz um - so behauptet es jedenfalls Nvidia - 50 Prozent angestiegen. Unterm Strich sei die Performance bei FP32- und FP64-Berechnungen deutlich gestiegen.

Hinzu kommen in der Tesla V100 Nvidia neue, sogenannten "Tensor Cores", die speziell für Deep Learning gebaut wurden. Durch die insgesamt 640 Tensore-Kerne, so Nvidia, liefere die V100 120 Teraflops für die Leistung von Deep Learning, was der Leistung von 100 CPUs entspreche.



Was die Performance bei Berechnungen angeht, nennt Nividia bei der Tesla V100 folgende Maximal-Werte: 7,5 TFLOP/s bei FP64 (double precision floating-point), 15 TFLOP/s bei FP32 (single precision) und 120 Tensor TFLOP/s (mixed-precision matrix-multiply-and-accumulate).

Die Tesla V100 besitzt außerdem 16 GB ultraschnellen 4096-bit HBM2-Speicher, der Geschwindigkeiten von bis zu 900 Gigabyte pro Sekunde erreicht.

Offen ist derzeit, wann Nvidia die ersten Volta-GPUs für Endanwender vorstellen wird. Eher unwahrscheinlich ist, dass auch hier HBM2-Speicher zum Einsatz kommt, immerhin ist der noch relativ teuer...