2604777

Nvidia GeForce RTX 4000: Alles zu Performance, Preis und Release

08.09.2022 | 15:02 Uhr | Sebastian Schenzinger

Nvidias nächste GPU-Generation RTX 4000 alias Ada Lovelace soll mehr als die doppelte Performance der aktuellen Ampere Grafikkarten erreichen können. Wir fassen alle Gerüchte zu den technischen Daten, der Performance, dem Release und den zu erwartenden Preisen zusammen.

Bald zwei Jahre ist es her seit Nvidia mit der GeForce RTX 3080 (zu unserem Testbericht)  die erste Grafikkarte auf Basis der aktuellen Ampere-Architektur veröffentlicht hat und schon seit längerem gibt es immer mehr Gerüchte zu deren Nachfolger, namentlich Ada Lovelace. Die BFGPU GeForce RTX 3090 (zu unserem Testbericht)  bietet gegenüber ihrem direkten Vorgänger ein Leistungsplus von rund 50 Prozent beim Gaming in UHD-Auflösung und bis zu einer Verdopplung der Anwendungs-Performance. Die kommenden RTX 4000 Grafikkarten sollen laut den Gerüchten durch das erwartete 5-nm-Fertigungsverfahren eine vergleichbar große Leistungssteigerung mit sich bringen. Da bis zum Start nur noch ein paar Wochen vergehen dürften, haben wir schon einmal alle Gerüchte und Leaks für Sie zusammengefasst und aktualisieren diese laufend.

RTX 4000 bzw. eine mögliche RTX 4080 steht in den Startlöchern - obwohl noch nicht mal die RTX-3000-Karten in der breiten Masse angekommen sind - und wenn dann zu übertriebenen Preisen. Trotzdem arbeitet Nvidia natürlich bereits an der Nachfolger-Generation aka Ada Lovelace und die soll natürlich wieder einen gewaltigen Leistungssprung bieten - aber auch einen krassen Stromhunger haben. Basti hat sich die aktuellen Gerüchte rund um RTX 4000 mal genauer angeschaut.

► Warum es keine HMX 4 geben wird:
youtu.be/3g51iqig-X0

► Alle RTX-4000-Gerüchte zum Nachlesen:
www.pcwelt.de/2604777

Alle Informationen auf einen Blick

In der folgenden Tabelle haben wir alle Gerüchte bezüglich den Spezifikationen der RTX-4000-GPUs für Sie zusammengefasst:

Mögliche GPU

Test-Board

Titan AD  

RTX 4090 Ti  

RTX 4090

RTX 4080 Ti  

RTX 4080

RTX 4070

RTX 4060 Ti  

RTX 4060

RTX 4050 Ti  

RTX 4050

Grafik-Chip

AD102

AD102

AD102

AD102

AD102

AD103 / AD104

AD104

AD104

AD106

AD106

AD107

Fertigung

TSMC 4N

TSMC 4N

TSMC 4N

TSMC 4N

TSMC 4N

TSMC 4N

TSMC 4N

TSMC 4N

TSMC 4N

TSMC 4N

TSMC 4N

SM

144

142

140

128

112

76

60/ 56

48

31

22  

16

TPC

72

71

70

64

56

38

30 / 28

24

16?

11  

8

GPC

12

12

12

12

12

7

5

5

3

3  

2  

Shader-Einheiten

18.432

18.176

17.920

16.384

14.848

9.728

7.680 / 7.168

6.144

3.968

2.816

2.048

L2-Cache

96 MB

96 MB

96 MB

96 MB

80 MB

64 MB / 48 MB

48 MB / 40 MB

40 MB

32 MB

32 MB  

32 MB

Speicherbus

384-bit

384-bit

384-bit

384-bit

320-bit

256-bit / 192-bit

192-bit / 160-bit

160-bit

128-bit

128-bit

128-bit

Videospeicher

48 GB GDDR6X

48 GB GDDR6X

24 GB GDDR6X

24 GB GDDR6X

20 GB GDDR6X

16 GB GDDR6X / 12 GB GDDR6X

12 GB GDDR6X /  10GB GDDR6X

10 GB GDDR6

8 GB GDDR6

8 GB GDDR6  

8 GB GDDR6

Speicher-Takt

24 GB/s

24 GB/s

24 GB/s

21 GB/s

21 GB/s

23 GB/s / 21 GB/s

21 GB/s

17,5 GB/s

17 GB/s

16 GB/s  

14 GB/s

Default TGP

~900W

~800W

~ 600 W

~450 W

?

~340 W / 285 W

~250 W / ~285 W

~270 W

~230 W

~170 W

~130 W

Max TGP  

?

?

?

~660 W

?

~516 W / ~366 W

?

?

?

?

?

Basistakt  

?

?

?

2235 MHz

?

?

2310 MHz

?

?

?  

?

Boost-Takt  

?

?

?

2520 MHz

?

2505 MHz / 2610 MHz

2610 MHz

?

?

?

?

Maximaltakt

?

?

?

2750 MHz

?

?

>2800 MHz

?

?

?

?

FP32-Performance

?

?

?

~ 90,1 TFLOPs

?

?

~43,0 TFLOPs / ~40,1 TFLOPs

?

?

?

?

TimeSpy Extreme  

?

?

?

~20.000

?

~15.000  

~11.000 / ~10.000

~8.600

~6.000

?

?

Launch  

?

?

?

Oktober 2022

?

November 2022

2023

?

2023

?

?

Wann sollen die RTX 4000 Grafikkarten auf den Markt kommen?

Allzu lange müssen wir uns bis zur Vorstellung von RTX 4000 nicht mehr gedulden. So hat Nvidias CEO Jensen Huang im Zuge eines Investorenmeetings folgende Aussage fallen lassen:

Ich freue mich auf die GTC-Konferenz im nächsten Monat, auf der wir neue Fortschritte von RTX vorstellen werden, die 3D-Grafik und -Spiele neu erfinden, die anhaltenden Durchbrüche der KI und der Aufbau des Metaversums, der nächsten Evolution des Internets.

Die Keynote der GTC 2022 findet am 20. September um 17 Uhr deutscher Zeit statt, hier ist mit sehr hoher Wahrscheinlichkeit mit der Vorstellung von Ada Lovelace zu rechnen. 

Bezüglich dem Release gibt  wccftech  an, dass dieser sich um rund vier Wochen nach hinten verschoben habe als ursprünglich geplant, was mittlerweile mehrere andere Quellen bestätigt haben. Konkret ist von einem Release der RTX 4090 im Oktober die Rede. Die RTX 4080 soll im November nachfolgen und die RTX 4070 im Dezember, ehe die RTX 4060 im Januar auf der CES das Licht der Welt erblicken soll.  Als Gründe für die Verschiebung nennt wccftech Probleme bei der Ressourcenbeschaffung und den Abverkauf der aktuellen Ampere-Generation.

Diese Termine gelten aber nicht als gesichert, denn wie wir in diesem Beitrag berichten, sollen die Lager der Boardpartner und Händler so voll mit RTX 3000 GPUs sein, dass diese befürchten darauf sitzen zu bleiben. Da Nvidia Hilfe zugesichert hat, ist es nicht unwahrscheinlich dass sich der Release von Ada Lovelace nach hinten verschiebt. Das deckt sich auch mit einem Tweet von Greymon55 , wonach nur der AD102-Grafikchip noch 2022 auf den Markt kommen soll. Der AD103, AD104 und AD106 in Form der RTX 4080, RTX 4070 und RTX 4060 sollen dagegen erst im Jahr 2023 nachfolgen.

Das deckt sich auch mit Nvidias Abverkaufsstrategie, denn der Hersteller hat erst am 7. September die Preise der drei Topmodelle RTX 3090 Ti, RTX 3090 und RTX 3080 Ti drastisch reduziert , was dafür spricht, dass hier in Kürze ein Nachfolger auf den Markt kommt. Alle anderen Modelle von der RTX 3080 abwärts verfügen nach wie vor über ihre alte UVP und die Marktpreise liegen sogar noch knapp darüber. 

Fast doppelt so viele Rechenkerne und Rechenleistung bei enormer Leistungsaufnahme?

Ada Lovelace Architektur: Nvidia benennt seine Architekturen seit jeher nach bekannten Mathematikern und Physikern. Auf Turing und Ampere soll den Gerüchten zufolge Ada Lovelace folgen. Ada Lovelace arbeitete zusammen mit Charles Babbage an der Analytical Engine und formulierte in ihrer Arbeit, die weit über den ursprünglichen Ansatz von Babbage hinausging, die Grundidee der Informatik: das systematische Verarbeiten von Informationen. Wohingegen der bekannte Leaker kopite7kimi ursprünglich davon ausgegangen ist, dass es sich bei Ada Lovelace um einen Refresh von Ampere handelt, so gibt er mittlerweile an, dass es größere architektonische Änderungen geben soll wie zum Beispiel einen deutlich vergrößerten L2-Cache, weshalb der Performance-Zuwachs auch größer ausfallen dürfte als ursprünglich angenommen.

Nvidia gab im Zuge der Präsentation der Grafikarchitektur "Hopper" (zum Artikel) an, dass die neuen Grafikarten für Rechenzentren bei TSMC in der sogenannten 4N-Node gefertigt werden. Diese stellt eine stromsparendere Version der N5P-Node dar. Für Ada Lovelace setzt Nvidia noch auf einen monolithischen Grafikchip und nicht auf ein Chiplet-Design, das soll vorerst den professionellen "Hopper" Grafikkarten vorbehalten bleiben, aber das ist eine ganz andere Baustelle. Während die bisherigen Gerüchte von der N5 oder N5P Node ausgegangen sind, dürfte Nvidia für Ada Lovelace mit hoher Wahrscheinlichkeit auch auf TSMCs 4N-Node setzen.

Doppelte Rechenleistung: Bereits Ende des Jahres 2020 sind durch kopite7kimi Gerüchte aufgekommen, wonach der AD102-Grafikchip auf eine 12*6-Struktur setzen könnte. Übersetzt steht das für 12 Graphics Processing Cluster (GPC) in denen jeweils sechs Texture Processing Cluster (TPC) stecken. Wenn Sie immer noch nur Bahnhof verstehen, empfehlen wir Ihnen unseren "Deep Dive" zur aktuellen Ampere-Architektur, der Teil des Testberichts zur GeForce RTX 3080 (zu unserem Artikel) ist. 3DCenter.org folgert, dass daraus 144 Streaming Multiprozessoren (SM) und 18.432 Cuda-Kerne resultieren könnten, was bei einem Takt von 1,8 GHz zu einer Rechenleistung von ungefähr 66 TFLOPs führen würde. Zum direkten Vergleich: Der GA102-Grafikchip bietet bis zu 10.752 Cuda-Kerne und 38,7 TFLOPs FP32 bei vergleichbarem Takt. Das entspräche beides nahezu einer Verdopplung gegenüber dem direkten Vorgänger.

Bei der Verdopplung soll es aber nicht bleiben, denn Nvidia wird vermutlich auch die Taktraten nach oben schrauben. Gingen die bisherigen Gerüchten von 2,2 bis 2,4 GHz aus, so sprechen die neuesten Leaks von deutlich höheren Taktraten von 2,8 bis 3,0 GHz. Damit könnte das Ada Lovelace Flaggschiff zur ersten Gaming-GPU werden, welche die 100 TFLOPs Schallmauer durchbricht, denn aus einem Boost-Takt von 2,8 GHz bei 18.432 Recheneinheiten resultiert eine FP32-Performance von 103 TFLOPs. Das aktuelle Topmodell, die RTX 3090 Ti, kommt im Vergleich dazu auf "nur" 40 TFLOPs. Das setzt aber auch voraus, dass der AD102-Grafikchip im Vollausbau zum Einsatz kommt, was nach aktuellem Stand bestenfalls bei einer TITAN-Grafikkarte der Fall sein könnte. 

Als Videospeicher soll Nvidia nach wie vor auf GDR6X VRAM setzen, jedoch mit höheren Taktraten von bis zu 24 Gbps. So sind auf einem Test-Board auch schon 48 GB GDDR6X VRAM mit 24 Gbps zum Einsatz gekommen und Micron hat sogar Module mit bis zu 27 Gbps angekündigt . Interessant ist, dass Nvidia AMD wohl mit den eigenen Waffen schlagen will. So hat AMD mit der RDNA-2-Architektur den sogenannten Infinity Cache eingeführt, welcher die Speicherbandbreite deutlich erhöht, weshalb die Breite des Speicher-Interface nicht mehr so wichtig ist. Laut  harukaze5719 soll Nvidia bei Ada Lovelace auf ein ähnliches Feature setzen und den L2-Cache beim AD102 Grafikchip auf 96 MB vergrößern. Beim GA102 der RTX 3090 Ti lag die Cache-Größe noch bei 6 MB. 

An den Spezifikationen von Anfang März hat sich in den letzten Wochen immer wieder etwas geändert. wie ein Tweet von kopite7kimi zeigt. Demnach sind bei der RTX 4080 und RTX 4070 mit etwas weniger Shader-Einheiten zu rechnen und auch bei der Speicherausstattung sowie der TGP hat sich nochmal etwas verändert. Diese neuen Gerüchte müssen übrigens nicht bedeuten, dass die ersten Leaks "falsch" waren, sondern verdeutlichen vielmehr, dass Nvidia unterschiedliche Konfigurationen austestet, bis das finale Produkt steht. Je näher wir dem Release kommen, desto realistischer ist es, dass die aufgeführten Spezifikationen korrekt sind. Die stets aktuellen Spezifikationen können Sie der Tabelle am Anfang des Artikels entnehmen. 

Eine spannende Info gibt es noch in Puncto PCIe-Anbindung. So soll Ada Lovelace gemäß kopite7kimi nur auf PCIe 4.0 und noch nicht auf PCIe 5.0 setzen. Vermutlich brächte die in der Theorie doppelt so hohe Bandbreite in der Praxis keinen Mehrwert, sondern nur Nachteile wie eine höhere Leistungsaufnahme und höhere Fertigungskosten mit sich.

Hinweis: An dieser Stelle müssen wir hinzufügen, dass sich die FP32-Rechenleistung nicht 1:1 in der Gaming-Performance widerspiegelt. So kommt die RTX 2080 Ti FE nur auf eine FP32-Rechenleistung von 14,23 TFLOPs, die RTX 3080 Ti dagegen auf 34,2 TFLOPs und damit auf mehr als das doppelte. Trotzdem trennen die beiden GPUs beim Gaming in 2160p nur etwa 50 Prozent. Der Leistungssprung auf eine mögliche RTX 4080 Ti dürfte ähnlich ausfallen. Dem widerspricht ein Leak von QbitLeaks, der offizielle Performance-Zahlen von Nvidia in die Hände bekommen haben will. Demnach soll eine mögliche RTX 4090 um 80 bis 120 Prozent schneller sein als die RTX 3090 Ti.

Laut QbitLeaks sind das offizielle Performance-Werte von Nvidia im Vergleich der RTX 4090 und der RTX 3090 Ti.
Vergrößern Laut QbitLeaks sind das offizielle Performance-Werte von Nvidia im Vergleich der RTX 4090 und der RTX 3090 Ti.
© QbitLeaks

Enorme Leistungsaufnahme:  Bereits die aktuellen Grafikkartengenerationen von AMD und Nvidia haben sich das Performanceplus gegenüber ihren Vorgängern zum Teil mit einer erhöhten TDP der GPU erkauft. So liegt zum Beispiel die TGP der RTX 3090 Ti bei satten 450 Watt, wohingegen sich die RTX 2080 Ti noch mit 260 Watt begnügte. Laut den Gerüchten dürfte hier leider noch nicht das Ende der Fahnenstange erreicht sein, was auch plausibel ist. Zwar sorgt das 5-nm-Fertigungsverfahren für eine verbesserte Energieeffizienz, aber eine Erhöhung der Shader-Einheiten um 71 Prozent bei einer gleichzeitigen Taktsteigerung von über 50 Prozent dürfte ohne einen Anstieg der Leistungsaufnahme nicht realisierbar sein. Gingen die ersten Gerüchte noch von 450 bis 500 Watt für das Topmodell aus, so sind mittlerweile noch viel erschreckendere Zahlen aufgetaucht. 

So will kopite7kimi die finalen Power Limits der vier Grafikchips erfahren haben. Bei den Werten handelt es sich zwar um die maximal zulässige Leistungsaufnahme, und nicht um die tatsächliche TGP der Grafikkarten, dennoch sind die Zahlen erschreckend hoch und absolut nicht zeitgemäß. Konkret ist beim AD102, welcher bei der RTX 4090 (Ti) zum Einsatz kommen soll, die Rede von aberwitzigen 800 Watt. Auch bei den weiteren Grafikchips soll sich das Power Limit im Vergleich zum direkten Vorgänger deutlich erhöhen. 240 Watt stehen für die vorerst kleinste GPU, die RTX 4070, im Raum. Damit läge das Power Limit eines Modells der Mittelklasse so hoch wie beim ehemaligen Topmodell RTX 2080 Ti. Des weiteren gibt der Leaker auch die Power Limits der mobilen Ableger an, die sich auf einem Niveau mit den aktuellen Modellen bewegen. Für alle, die sich Fragen, wie die Grafikkarte gekühlt werden soll, hat kopite7kimi ebenfalls eine Antwort parat. So könnte Nvidia erstmals auf einen Kühler mit drei Lüftern bei der Founders Edition setzen.

Mittlerweile hat kopite7kimi in weiteren Tweets konkrete Zahlen zur Total Board Power (TBP) genannt. Konkret soll die RTX 4090 450 Watt benötigen, die RTX 4080 340 Watt, die RTX 4070 285 Watt und die RTX 4060 240 Watt. Bezüglich den kleineren Modellen hat QbitLeaks noch konkretere Zahlen genannt, welche aus einem Test stammen sollen. Demnach benötigt die RTX 4060 Ti zwischen 270 und 280 Watt und die RTX 4060 zwischen 230 und 240 Watt. 

Es sind sogar Informationen zu einem Test-Board einer AD102-GPU mit 900 Watt TGP, zwei 16-Pin Strom-Anschlüssen und 48 GB GDDR6X Videospeicher mit 24 Gbps aufgetaucht, ob es sich dabei möglicherweise um eine RTX 4090 Ti oder einen Titan Nachfolger handelt, bleibt fraglich, wobei es laut kopite7kimi tatsächlich wieder eine TITAN GPU geben soll. Da das erste TITAN-Modell am 19. Februar seinen 10-järhigen Geburtstag feiert, wäre das auf jeden Fall ein würdiger Anlass für einen Nachfolger. Auch unter Anbetracht der Tatsache. dass viele neue Modelle der Netzteilhersteller mit über 1000 Watt spezifiziert sind und mit dem neuen PCIe-5.0-Setcker ausgestattet sind, welcher bis zu 600 Watt liefern kann, klingen die Gerüchte leider nicht nicht allzu weit hergeholt. 

Wie viel werden die RTX-4000-GPUs kosten?

Auch wenn der Release der RTX-4000-Grafikkarten nicht mehr in allzu ferner Zukunft liegt, gibt es bisher noch keine Aussagen zu konkreten Preisen, aber wir können die Preise der letzten drei Generationen analysieren:

  • GTX 1060 6 GB FE (ab 320 Euro) --> RTX 2060 FE (ab 369 Euro) --> RTX 3060 (ab 329 Euro)

  • GTX 1070 FE (ab 499 Euro) --> RTX 2070 FE (ab 639 Euro) --> RTX 3070 FE (ab 549 Euro)

  • GTX 1080 FE (ab 789 Euro) --> RTX 2080 FE (ab 849 Euro) --> RTX 3080 FE (ab 759 Euro)

  • GTX 1080 Ti FE (ab 819 Euro)  --> RTX 2080 Ti FE (ab 1249 Euro) --> RTX 3080 Ti FE (ab 1269 Euro)

Wir haben uns bei den Preisen nur an den Founders Editions respektive der offiziellen UVP von Nvidia orientiert. Custom Modelle mögen je nach Ausführung zu einem niedrigeren oder höheren Preis erhältlich gewesen sein. Letztendlich bestimmt vor allem die Nachfrage den Preis, wie sich auch in den letzten zwei Jahren gezeigt hat. Mit der Einführung der ersten Grafikkarten mit hardwareseitigem Raytracing-Support und DLSS hat Nvidia einen ordentlichen Preisaufschlag vorgenommen. Mit den RTX-3000-GPUs sind die Preise zumindest auf dem Papier wieder etwas gesunken, was auch an der Rückkehr von AMD in den High-End-Bereich liegen mag. Unser Grafikkarten-Vergleich (zum Artikel) zeigt, dass AMD aktuell nämlich konkurrenzfähige Modelle im Portfolio hat. 

Im Vergleich zu früheren Generationen sind die Ampere-GPUs allerdings definitiv nicht als günstig zu bezeichnen. An dieser Stelle können wir uns aber nur wiederholen: Die Nachfrage bestimmt den Preis. Und die schlechte Verfügbarkeit hat gezeigt, dass Gamer bereit dazu sind, für eine RTX 3060 auch mal 600 Euro respektive für eine RTX 3090 über 2000 Euro auszugeben. Diese Tatsache wird auch Nvidia nicht entgangen sein, sodass kein wirklicher Zwang besteht, die Preise für die kommenden RTX-4000-Grafikkarten niedriger anzusetzen. Es sei denn, AMD gelingt mit den RX-7000-GPUs (zum Artikel) der große Wurf und Nvidia muss über günstigere Preise konkurrieren. Gerade im Einsteigersegment könnte auch Neuling Intel mit den Arc Alchemist GPUs (zum Artikel) für niedrigere Preise sorgen. 

Für einen weiteren Preisanstieg spricht eine Meldung von Wccftech (zum Artikel) . Demnach soll nicht nur Nvidia, sondern auch AMD und Intel die Preise für High-End-Produkte im Jahr 2022 um bis zu 20 Prozent erhöhen. Grund dafür ist, dass Auftragsfertiger TSMC die Preise je nach Fertigungstechnologie um zehn bis 20 Prozent erhöht hat, was sich dann mit hoher Wahrscheinlichkeit auch auf den Endkäufer auswirken wird. Auch der im Regelfall gut informierte Leaker kopite7kimi gibt an, dass wir auf keinen Fall mit einer niedrigeren UVP rechnen sollen.

Hinweis: Bei den Leaks und Gerüchten in diesem Artikel handelt es sich um keine gesicherten Informationen. Nvidia selbst hat zu einem Nachfolger für Ampere noch nichts bekannt gegeben. Nichtsdestotrotz handelt es sich bei den Leakern um recht verlässliche Quellen, die bereits in der Vergangenheit viele Spezifikationen richtig vorausgesagt haben.

PC-WELT Marktplatz

2604777