Für Supercomputer und Datenbank-Server ist der Nvidia A100 konzipiert, den der Grafikspezialist heute auf der Keynote der GDC vorgestellt hat. Der Nvidia A100 ist der erste Grafikprozessor des Herstellers auf Basis der Ampere-Architektur, die im Oktober 2020 auch bei den Gaming-Grafikkarten der RTX 30×0-Serie Einzug halten soll. Der Nvida A100 stellt Superlativen auf: Mit einer Chipfläche von 826 Quadratmillimetern und bis zu 54 Milliarden Schaltkreisen ist der A100 nicht nur der größte, sondern auch der komplexeste Grafikprozessor der Welt, den Auftragsfertiger TSMC im 7-nm-Verfahren produziert.
Bei der schnellsten, größten und schwersten “Grafikkarte” der Welt, sind acht A100-Grafikprozessoren auf dem System-Board DGX A100 verbaut. Die acht GPUs sind per NV-Link 3.0 zu einem Grafikkartenverbund zusammengeschaltet und können gemeinsam auf 320 GB HBM2-Speicher zugreifen. Insgesamt besteht die DGX A100 aus 30.000 Einzelteilen und bringt ein Gewicht von 25 Kilogramm auf die Waage. Neben der beindruckenden Rechenleistung sind auch die Kosten und der Stromverbrauch astronomisch: Die DGX A100 soll rund 200.000 Dollar kosten und bis zu 5,6 Kilowatt verbrauchen.

©Nvidia
Bei der Fertigung nutzt TSMC das sogenannte CoWoS-Packaging, ein Verfahren bei dem GPU und Speicher auf dasselbe Substrat kommen. Die räumliche Nähe erlaubt es, dem Grafikprozessor Daten deutlich schnell mit dem Videospeicher auszutauschen. Apropos Speicher: Auch beim A100 setzt Nvidia weiterhin auf HBM2-Speicher, die Kapazität erhöht sich gegenüber dem Vorgänger Volta von 32 auf 40 GB, die Speicherbandbreite soll bei 1,56 TB/s liegen. Gaming-Grafikkarten mit Ampere-Architektur wird Nvidia weiterhin mit GDDR6-Speicher ausstatten, beim neuen Spitzenmodell Nvidia GeForce RTX 3080 Ti beziehungsweise RTX 3900 dürften es wahrscheinlich 12 respektive 16 GB sein.

©Nvidia
Die Rechenleistung des A100 soll laut Nvidia bis zu 1248 Teraflops betragen, also 1248 Billionen Rechenoperationen pro Sekunde. Das gilt allerdings nur für INT8-Berechnungen auf den Tensor-Cores, die für KI-Aufgaben spezialisiert sind. Die gängige Angabe zur Einschätzung der Rechenleistung bei Grafikprozessoren in Form von Fließkommaberechnungen mit einfacher Genauigkeit (FP32) liegt beim A100 bei 19,5 Teraflops. Zum Vergleich: Der Profi-Vorgänger Volta kommt auf 14,1 Teraflops und das Gaming-Spitzenmodell RTX 2080 Ti auf 15,3 Teraflops.
Gegenüber dem Volta-Vorgänger steigt die Anzahl der Shader-Einheiten von 5120 auf 6912, ein Plus von immerhin 35 Prozent. Dafür reduzieren sich die Tensor-Einheiten von 640 auf 432. Im Gegenzug bekommt Ampere aber ein deutlich effizientere Format namens “Tensor Float 32” spendiert. Das neue Format, ein Mix aus einfacher und halber Genauigkeit, soll die Trainingsgeschwindigkeit der KI-Recheneinheiten glatt verdoppeln.
Gaming-Grafikkarten mit Ampere-Architektur: Was verrät uns der A100
Der Nvidia A100 erlaubt kaum Rückschlüsse auf die nächste Gaming-GPU-Generation mit Ampere-Architektur: Die Shader-Einheiten könnten um 35 Prozent oder mehr steigen, da der Vollausbau von Ampere laut Nvidia bei 8192 Shader-Einheiten liegt. Die Tensor-Einheiten dürften wahrscheinlich ebenfalls um den Faktor 2 effizienter rechnen. Zudem wechselt Nvidia bei Ampere auf PCI-Express 4.0. Da Grafikkarten mit 16 Lanes an die CPU angebunden sind, verdoppelt sich die Bandbreite auf 32 GB/s. Belastbare Infos zu den Raytracing-Einheiten gab es überhaupt nicht – Gerüchten nach soll sich die Rechenleistung hier vervierfachen.
Unbestätigt bleibt auch der Launch-Termin für September oder Oktober 2020 und die Grafikprozessor-Varianten: Das neue Spitzenmodell könnte unter dem Namen Nvidia Geforce RTX 3090 mit 16 GB GDDR6-Speicher für rund 1500 Euro auf den Markt kommen. Die Nvidia Geforce RTX 3080 Ti mit 12 GB GDDR6-Speicher soll etwa 1300 Euro kosten und die Nvidia Geforce RTX 3080, ebenfalls mit 12 GB Videospeicher, knapp 1000 Euro.