Nvidia hat auf der GTC mit "Hopper" die nächste Generation an Rechenzentren-GPUs vorgestellt. Bei der Fertigung setzt Nvidia auf TSMCs 4N-Verfahren. Zudem sind PCIe 5.0 und NVLink 4 mit an Board. Wir haben uns angeschaut, was das für die RTX-4000-GPUs bedeuten könnte.

Im Zuge der GTC 2022 Keynote (zum Video) am 22. März enthüllte Nvidia CEO Jensen Huang offiziell die Grafikarchitektur "Hopper", welche die nächste GPU-Generation des Unternehmens antreibt - zumindest die Modelle für Rechenzentren. Das Debüt von Hopper erfolgt mit dem für Rechenzentren konzipierten Nvidia H100, einem riesigen Chip mit 80 Millionen Transistoren gepaart mit HBM3-Speicher der nächsten Generation und der weiterentwickelten NVLink-Verbindungstechnologie des Unternehmens. Hopper ist "unser bisher größter Generationssprung", erklärt Huang stolz.

Die Vorstellung neuer Architekturen von Nvidia auf der GTC hat Tradition: auch Ampere, Volta und Pascal standen dort im Rampenlicht.

Genau wie bei den vorangegangenen Enthüllungen ist die H100 zwar stark auf den Einsatz in Rechenzentren spezialisiert - aufgrund der mit Tensor-Cores-beladenen Hardware-Konfiguration, die zur Optimierung von Deep-Learning-Aufgaben entwickelt wurde -, aber das bedeutet nicht, dass sich für PC-Spieler nicht einige Informationen aus Hoppers KI-zentrierter Vorstellung ableiten lassen. Selbst wenn eine mögliche RTX 4080 und ihresgleichen auf der "Lovelace"-Architektur basieren dürfte, wie einige aktuelle Gerüchte vermuten lassen.

Das sind die wichtigsten Punkte, weshalb "Hopper" auch für PC-Gamer interessant ist:



1. Hopper setzt auf TSMCs 4N-Prozess

Nvidias Turing-Grafikprozessoren der RTX 20-Serie wurden bei TSMC gefertigt, dem Auftragsfertiger, der auch Chips für AMD, Apple, Intel und praktisch alle führenden Technologieunternehmen herstellt. Die Ampere-GPUs der GeForce RTX 30-Serie werden stattdessen im 8nm-Prozess von Samsung gefertigt. Die GPUs liefern eine beeindruckende Performance, verbrauchen aber auch eine Menge Strom, wie etwa unser Test der RTX 3090 zeigt.

Für Hopper - oder zumindest den H100 - kehrt Nvidia zu TSMC zurück. Den Chip fertigt TSMC in einem speziell für Nvidia optimierten 4N-Prozess, welcher letztlich eine stromsparendere Version des N5P-Fertigungsverfahren ist. Ein Blick in unseren Grafikkartenvergleich zeigt, dass AMDs aktuelle RX-6000-Grafikkarten, welche TSMC im 7-nm-Verfahren fertigt, energieeffizienter arbeiten als Nvidias RTX-3000-GPUs. Deswegen wäre es nicht unwahrscheinlich, dass Nvidia für die RTX-4000-Modelle auf das gleiche Fertigungsverfahren wie bei Hoppers setzen will, die aktuellen Gerüchte weisen auf jeden Fall darauf hin.

2. PCIe Gen 5 (und NVLink 4)

AMDs Grafikkarten der Radeon RX 5000-Serie waren die ersten Modelle, welche auf PCIe 4.0 setzten, aber so wie es aussieht, dürfte Nvidia bei PCIe 5.0 die Nase vorne haben. So ist der H100 der erste Grafikprozessor, welcher mit der noch schnelleren Verbindungstechnologie ausgestattet ist und da Intels Core-Prozessoren der 12. Generation vor Kurzem PCIe 5.0-Unterstützung für Mainstream-Desktops gebracht haben, gibt es allen Grund anzunehmen, dass Nvidia auch bei den GeForce-GPUs der nächsten Generation auf PCIe Gen 5 setzen wird.

Wie viel die höhere Bandbreite letztlich wirklich bringt, muss sich in den Tests erst noch zeigen. Zwischen einem PCIe 3.0 x16 und einem PCIe 4.0 x16 Interface fallen die Unterschiede selbst mit einem aktuellen Topmodell äußerst gering aus.

Hopper markiert auch das Debüt der vierten Generation von NVLink, Nvidias proprietärem Interconnect für hohe Bandbreiten. Bei der RTX 30-Serie beschränken sich Multi-GPU-Konfigurationen einzig und allein auf das Flaggschiff GeForce RTX 3090. Wenn Nvidia weiterhin Multi-GPU-Unterstützung in den GeForce-Flaggschiff-Karten anbieten will, werden diese durch NVLink 4 von einer größeren Bandbreite profitieren können. Die NVLink 4-Implementierung der H100 schafft laut Nvidia eine Übertragungsrate von 900 GB/s, im Vergleich dazu kommt die Ampere-basierte A100 mit NVLink der dritten Generation auf 600 GB/s.

3. Viel Leistung, aber auch hohe Leistungsaufnahme

Die H100 ist in hohem Maße für Aufgaben in Rechenzentren optimiert und Nvidia hat (seltsamerweise) keine Informationen über die Anzahl an CUDA-Kernen, die Taktraten oder die Größe der GPU-Die preisgegeben - alles Dinge, die viel mehr Aufschluss darüber geben würden, was von den zukünftigen GeForce-Karten zu erwarten ist. Aber die Spezifikationen, die das Unternehmen enthüllt hat, zeigen, dass Nvidia keine Angst hat, mit Hopper groß herauszukommen.

Der Hopper-Grafikprozessor im Flaggschiff H100 verfügt über enorme 80 Milliarden Transistoren - ein beachtlicher Sprung gegenüber den 54,2 Milliarden Transistoren im Ampere-basierten A100 und fast viermal so viele Transistoren wie die 21,1 Milliarden, welche im Volta-basierten V100 stecken.

Um all diese Transistoren zu Höchstleistungen treiben zu können, ist allerdings eine Menge an Leistung nötig. Nvidia gibt an, dass der H100 bis zu 700 Watt benötigt, das sind 300 Watt mehr als der schnellste A100-Chip. Das bedeutet nicht unbedingt, dass die GeForce-GPUs der RTX 4000-Serie ebenfalls Stromfresser sein werden, aber aktuelle Gerüchte deuten darauf hin, dass Nvidias Grafikkarten der nächsten Generation viel Leistung verbrauchen werden.

Die Leaks sprechen beim Topmodell derzeit von 600 Watt und mehr. Die Tatsache, dass die H100 so viel Watt benötigt, untermauert diese Behauptungen, auch wenn wir auf die offizielle Enthüllung der GeForce-Grafikkarten der nächsten Generation warten müssen, um es genau zu wissen.

Was wir uns noch gewünscht hätten

Deutlich mehr Informationen. Die GTC-Enthüllungen vergangener Nvidia-Architekturen lieferten viel mehr Details über die Anzahl der Kerne und die Taktrate, was einen viel tieferen Einblick darin gab, was man von den verbraucherorientierten GeForce-Ablegern erwarten kann. Gerüchte über die RTX 4080 und ihre Geschwistermodelle, welche auf der "Lovelace"-Architektur basieren sollen, gibt es zwar viele, zum Teil widersprechen sich diese aber auch ineinander. Die H100 soll im dritten Quartal auf den Markt kommen, und wir erwarten, dass wir bis dahin auch mehr über die GeForce-GPUs der nächsten Generation erfahren werden.

Update: Nach der Keynote hat Nvidia noch einige dieser Informationen nachgeliefert, die wir im folgenden zusammengefasst haben:

GH100 GPU im Vollausbau:



8 GPCs, 7 TPCs (9 TPCs/GPC) und 144 SMs (2 SMs/TPC)

18.432 FP32-Cuda-Kerne (128 FP32-Cuda-Kerne pro SM)

576 Tensor-Cores der vierten Generation

6 HBM3 oder HBM2e Stacks

12x 512-bit Speicher-Controller

NVLink 4 und PCIe 5.0

Die 18.432 Cuda-Cores der GH100 GPU entsprechen dabei exakt der gleichen Anzahl an Rechenkernen, welche für das Ada Lovelace Topmodell mit AD102 GPU vermutet werden.

Hinweis: Dieser Artikel erschien zuerst bei unseren englischsprachigen Kollegen der PCWorld unter dem Titel "Nvidia’s next-gen Hopper GPU revealed: 3 things PC gamers need to know" .