1994424

Nvidia Geforce GTX 980 im Test

19.09.2014 | 04:30 Uhr |

Da ist das Ding: Nvidia verspricht mit der zweiten Maxwell-Generation für die neue Geforce-Oberklasse nicht nur mehr Leistung, sondern auch noch einen viel geringeren Stromverbrauch. Hinzu kommen neue Techniken, die besonders Gamer begeistern dürften.

Viele Gerüchte gab es um die nächste Grafik-Oberklasse aus dem Hause Nvidia, von utopischen Ausstattungs-Varianten, bis hin zu nur kleinen Veränderungen zum Vorgänger. Selbst bei der Modellbezeichnung gab es Unsicherheiten – doch ab heute ist damit Schluss. Das neue Grafik-Flaggschiff hört auf den Namen Nvidia Geforce GTX 980 und ist mit der Maxwell-GPU der zweiten Generation ausgestattet, dem GM204. Offiziell handelt es sich also um den direkten Nachfolger der Geforce GTX 680 mit dem GK104, und nicht der GTX 780 mit dem GK110. Neben der GTX 980 kommt zeitgleich auch die GTX 970 auf den Markt. Wir haben ein Sample von Gigabyte im Test, die Geforce GTX 970 OC aus der G1-Gaming-Serie.

Die Grafikkarten stellt Nvidia heute übrigens auch in einem 24-stündigen Live-Stream vor, den Sie unter www.game24.nvidia.com live mitverfolgen können. In unserer News können Sie nachlesen, was der Hersteller für seinen Marathon-Stream geplant hat.

Laut Nvidia handelt es sich bei diesem Chip um die „am weitesten fortgeschrittene GPU die jemals gebaut wurde“ und verspricht eine unerreichte Energieeffizienz, eine außerordentliche Spieleerfahrung sowie eine neue Beleuchtungs-Technik. Wir haben die neue Grafikkarte im Test und klären, wie es tatsächlich um den Energieverbrauch und die Leistung in der Praxis steht und welche Neuerungen auf Gamer zukommen. Denn mit der ersten Maxwell-Generation in der GTX 750 (Ti) konnte Nvidia schon beweisen, wie das Energiesparen funktioniert. Natürlich haben wir die neue Oberklasse-Karte auch gegen den ärgsten Konkurrenten im Test, der AMD Radeon R9 290X.

Direkt zum Test-Fazit zur Nvidia Geforce GTX 980 auf Seite 2

Nvidia Geforce GTX 980: Technik im Detail

Genau wie die Vorgänger-Architekturen Fermi und Kepler handelt es sich beim Maxwell-Grafikchip „GM204“ um einen Zusammenschluss verschiedener Bestandteile: Aus GPCs (Graphic Processing Cluster), SMs (Streaming-Multiprozessoren) und Speicher-Controllern. Der GM204 besteht dabei aus vier GPCs, 16 Streaming-Multiprozessoren-Maxwell (SMM) und vier Speicher-Controllern. Jeder GPC verfügt über eine eigene Raster-Engine (bezeichnend für die Hardware zum Rastern von Grafiken) sowie vier SMMs. Die Streaming-Mulitprozessoren wiederum arbeiten mit je 128 Cuda-Shader-Kernen, einer eigenen Polymorph-Engine (die Ausführungseinheit für Geometrieberechnungen wie der Tesselation) und acht Textureinheiten (TMUs). Jedem der vier 64-Bit-Speicher-Controller sind je 16 Raster-Operations-Prozessoren (ROPs) sowie jeweils 512 KB Level-2-Cache zugeordnet. Die ROPs zeichnen sich verantwortlich für das Berechnen der Pixel und schreiben die Daten in den Grafikspeicher.

Die Maxwell-GPU GM204 im Detail: Größerer Cache, mehr Streaming-Multiprozessoren sowie mehr ROPs.
Vergrößern Die Maxwell-GPU GM204 im Detail: Größerer Cache, mehr Streaming-Multiprozessoren sowie mehr ROPs.
© Nvidia

Damit kommt der Maxwell-Chip der zweiten Generation auf insgesamt 2048 Cuda-Kerne (Shader-Einheiten), 128 Textureinheiten und 64 ROPs neben einem insgesamt zwei Megabyte großen Level-2-Cache. Gegenüber dem Vorgänger GK104 (Kepler) hat sich die Anzahl der Streaming-Multiprozessoren und ROPs also verdoppelt und der Cache hat sich vervierfacht – besonders bei vielfacher Kantenglättung sowie in hohen Auflösungen soll sich das bemerkbar machen. Dennoch ist die Chipfläche nur gering gewachsen, und zwar von 294 auf 398 Quadratmillimeter. Es fällt auf, dass die Anzahl der Textureinheiten gleich geblieben ist, doch Nvidia verspricht dank der gestiegenen Taktraten eine 12 Prozent flottere Pixelfüllrate. Der Grafikspeicher arbeitet mit effektiven 7000 MHz und zählt somit zum flottesten Speicher auf dem Markt, während sich der Standard-Takt des Chips auf hohe 1126 und der GPU-Boost auf 1216 MHz beläuft. Damit arbeitet die Geforce GTX 980 mit den flottesten Taktfrequenzen, mit der Nvidia jemals ein Referenz-Design ausgestattet hat.

Gestiegene Energieeffizienz dank besserer Nutzung der Ressourcen

Im Vergleich zum Vorgänger ist Speichertakt des insgesamt 4 GB großen GDDR5-Speichers rund 15 Prozent gestiegen und in der Kapazität um 2 GB gewachsen , während sich der Cache deutlich vergrößert hat und das Speicher-Interface 256 Bit breit ist. In Zusammenspiel mit der Maxwell-Architektur sind laut Nvidia nun weniger Speicheranforderungen nötig. Hinzu kommt eine neue Speicher-Komprimierung, auf die wir später noch eingehen.

Die SMMs (Maxwell-Streaming-Multiprozessoren) reizen die Cuda-Kerne nun öfter vollständig aus, während der größere Cache die Anzahl der Speicheranfragen reduziert. Ergebnis ist ein geringerer Stromverbrauch.
Vergrößern Die SMMs (Maxwell-Streaming-Multiprozessoren) reizen die Cuda-Kerne nun öfter vollständig aus, während der größere Cache die Anzahl der Speicheranfragen reduziert. Ergebnis ist ein geringerer Stromverbrauch.
© Nvidia

All diese Neuerungen haben auch Einfluss auf die Leistungsaufnahme: Nvidia gibt einen TDP von lediglich 165 Watt an und liegt damit sogar noch 30 Watt unter der Geforce GTX 680! Diese Energieeffizenz erreicht der Hersteller dank der Überarbeitung der Streaming-Multiprozessoren, die die Cuda-Einheiten nun häufiger voll ausnutzen. Aus diesen Gründen soll ein Cuda-Kern in Maxwell nun etwa 1,4 Mal mehr Leistung sowie zweimal mehr Leistung pro Watt im Vergleich zu Kepler bieten. Des Weiteren ist dafür auch der gewachsene Cache, weshalb nun weniger Speicheranfragen notwendig sind.

So funktioniert die Speicher-Kompression in Maxwell

Um die Speicherbandbreiten-Anforderungen zu reduzieren, verwendet die Maxwell-GPU eine verlustfreie Kompressions-Technik beim Schreiben der Daten in den Grafikspeicher. Die Komprimierung geschieht dabei in mehreren Stufen: Konstante 4x2-Pixelregionen in Farbblöcken komprimiert die Technik im Verhältnis 8:1 (beispielsweise 256 Bit zu 32 Bit bei 32 Bit Farbtiefe), 2x2-Pixelregionen werden immerhin noch in Verhältnis 4:1 verkleinert.

Die neue Speicher-Komprimierung kann Farbblöcke im Verhältnis 8:1 komprimieren und verringert damit die Speicherbandbreiten-Anforderungen.
Vergrößern Die neue Speicher-Komprimierung kann Farbblöcke im Verhältnis 8:1 komprimieren und verringert damit die Speicherbandbreiten-Anforderungen.
© Nvidia

Hinzu kommt die „Delta Color Compression“, die übrigens seit Fermi bereits an Bord ist. Hier berechnet der Chip die Unterschiede zwischen allen Pixeln im Farbblock und den jeweiligen Nachbarn im Block. Die Kompression versucht anschließend die Differenzen mit der kleinsten Anzahl an Bits zusammenzupacken. Zum Beispiel hat Pixel A den Rot-Wert 253 (8 Bit) und Pixel B den Rot-Wert 250 (8 Bit), dann ist die Differenz 3 und kann mit dem Minimum von 2 dargestellt werden. Ist es nicht möglich, einen Farbblock mit Hilfe einer der beiden Techniken zu komprimieren, schreibt die GPU die Daten ohne Bearbeitung heraus. Dank des gewachsenen Caches und der Kompression soll es Maxwell möglich sein, nun bis 25 Prozent weniger Bytes pro Bild aus dem Speicher holen zu müssen. Ergebnis soll eine effektivere Speicherbandbreite ein, eine Kepler-Grafikkarte müsste im Vergleich eine Bandbreite von 9,3 Gbit/s liefern, um das Niveau der 7 Gbit/s von Maxwell zu erreichen. In folgender Tabelle haben wir die aktuellen Oberklasse-GPUs miteinander verglichen.

Grafikkarten-Oberklasse: Technische Daten im Vergleich

Grafikkarte

Nvidia Geforce GTX 980

AMD Radeon R9 290X

Nvidia Geforce GTX 680

Nvidia Geforce GTX 780

Nvidia Geforce GTX 780 Ti

Grafikchip

GM204

Hawaii

GK104

GK110

GK110

Fertigung

28 Nanometer

Chipfläche

398 mm²

438 mm²

294 mm²

561 mm²

561 mm²

GPU-Standard-Takt / Boost-Takt

1127 / 1216 MHz

bis zu 1000 MHz

1006 / 1058 MHz

863 / 902 MHz

875 / 928 MHz

Shader-Einheiten

2048

2816

1536

2304

2880

TMUs

128

176

128

192

240

ROPs

64

64

32

48

48

GDDR5-Speicher

4096 MB

4096 MB

2048 MB

3072 MB

3072 MB

Speichertakt (effektiv)

7000 MHz

5000 MHz

6008 MHz

6008 MHz

7000 MHz

Speicheranbindung

256 Bit

512 Bit

256 Bit

384 Bit

384 Bit

Speicherbandbreite

224 GB/s

320 GB/s

192 GB/s

288 GB/s

384 GB/s

Maximaler TDP (Herstellerangaben)

165 Watt

300 Watt

195 Watt

250 Watt

250 Watt

Preis

540 Euro (unverbindliche Preisempfehlung)

375 Euro (Straßenpreis)

324 Euro (Straßenpreis)

380 Euro (Straßenpreis)

570 Euro (Straßenpreis)

Echtzeit-Beleuchtung in Spielen dank VXGI

Bisher verwenden Spiele verschiedene globale Beleuchtungsarten, bei denen es sich allerdings um vorab berechnete Lichteffekte handelt. Denn in der realen Welt erstrahlen alle Objekte dank direkten und indirekten Licht. Diese dynamische Echtzeit-Beleuchtung ist sehr rechenaufwändig, weshalb es Spieleentwicklern bisher vorbehalten war, sie in Spielen zu nutzen. Doch mit der neuen Nvidia-Technik VXGI (Voxel Global Illumination) soll sich das alles ändern: Die Technik verwendet ein Voxel-Gitter (Voxel Grid) sowie eine kegelförmige Verfolgungs-Technik (Cone Tracing) um die globale Beleuchtung sowie die Umgebungsverdeckung (Ambient Occlusion) in Echtzeit möglichst ressourcenschonend zu berechnen.

Nvidias VXGI soll eine nahezu realistische globale Beleuchtung bei relativ geringem Aufwand ermöglichen.
Vergrößern Nvidias VXGI soll eine nahezu realistische globale Beleuchtung bei relativ geringem Aufwand ermöglichen.
© Nvidia

Ein Voxel ist im Prinzip ein viereckiger Pixel, es verfügt also über ein Volumen. Um eine globale Beleuchtung zu schaffen ist es nötig zu wissen, dass sich das Licht an allen Objekten in der Szene bricht und verstreut, womit das direkte Licht nicht die einzige Quelle ist. Deshalb zerlegt VXGI die gesamte Szene in dreidimensionale Voxel. Jeder Voxel verfügt außerdem noch über die Information, wie das Licht physikalisch darauf reagieren soll. Danach erfolgt die Berechnung, wie viel direktes Licht die Voxel reflektieren. Hierauf erfolgt die Rasterung der Szene, die nun allerdings dank der zusätzlichen Informationen durch die Voxel-Daten-Struktur detaillierter ausfällt. Im letzten Rendering-Schritt erfolgt das Cone-Tracing, um die indirekte Beleuchtung zu berechnen. Anders als das herkömmliche Ray-Tracing benötigt das Cone-Tracing weniger Rechenpower und lässt sich als guter Ansatz der globalen Beleuchtung sehen.

Höhere Auflösung und glattere Kanten mit Geforce

Um ein verbessertes Spielerlebnis zu bieten, führt Nvidia mit der Geforce GTX 980 auch zwei zusätzliche Techniken für Gamer ein. Die erste hört auf den Namen „Dynamic Super Resolution“ (DSR), bei dem es sich im Prinzip um eine Downsampling-Technik handelt: Auf diese Weise lassen sich Spiele beispielsweise in 4K ausgeben, obwohl der Monitor nur 1080p beherrscht. Doch um die bisher entstandenen Probleme wie Bildartefakte zu vermeiden, verwendet Nvidia einen Gauss-Filter, der diese Bildfehler um ein Vielfaches reduzieren und die Bildqualität steigern soll. DSR lässt sich nun mit einem simplen Klick in Geforce Experience aktivieren, während das Programm die restlichen Grafik-Details anpasst, um ein weiterhin flüssiges Gaming zu ermöglichen. Nutzer müssen nun nicht mehr der Grafikkarte vorgaukeln, dass sie an hochauflösende Monitore angeschlossen wären, auch das Berechnen von individuellen Auflösungen entfällt. DSR kann bis zum Vierfachen der nativen Auflösung darstellen, der Grad des Gauss-Filters lässt sich nach eigenen Wünschen regeln.

Links Battlefield 4 in Full-HD, rechts die gleiche Szene in 4K dank aktiviertem DSR: Unten rechts auf "Zum Original-Bild" klicken für volle Auflösung und bessere Vergleichbarkeit!
Vergrößern Links Battlefield 4 in Full-HD, rechts die gleiche Szene in 4K dank aktiviertem DSR: Unten rechts auf "Zum Original-Bild" klicken für volle Auflösung und bessere Vergleichbarkeit!
© Nvidia

Für eine weitere optische Aufwertung kommt die neue Kantenglättungs-Technik „Multi-Frame sampled Anti Aliasing“ (MFAA) zum Einsatz. Während MSAA zwar sehr gute Ergebnisse abliefert, benötigt das Feature allerdings enorm viel Leistung, ganz besonders in hohen Auflösungen. Die neue Maxwell-Architektur unterstützt das Hardware-Feature „Multi-Pixel Programmable Sampling“, das flexiblere Kantenglättungs-Techniken ermöglicht. MFAA kann auf die Subpixel des vorherigen Frames zurückgreifen, um sie mit Hilfe eines zeitlichen Filters im selben Pixel des aktuellen Frames zusammenzulegen und die Farbe des Pixels zu bestimmen – so soll zweifaches MFAA. MFAA befindet sich zwar noch im Entwicklungsstadium, soll aber rund 30 Prozent schneller sein als herkömmliches MSAA.

Von der Qualität her lässt sich MFAA mit MSAA vergleichen, allerdings braucht die neuere Technik weniger Leistung.
Vergrößern Von der Qualität her lässt sich MFAA mit MSAA vergleichen, allerdings braucht die neuere Technik weniger Leistung.
© Nvidia

Geforce will die erste Wahl für Gamer sein

Neben den oben genannten Neuerungen profitieren Gamer natürlich weiterhin von den älteren Techniken wie zum Beispiel G-Sync: Bei dieser Technik befindet sich ein kleines Hardware-Modul im Monitor, das sich mit der GPU synchronisiert, um Inhalte flüssiger sowie hübscher darzustellen. Tearing (Einzelbild-Zerreißen) und Input-Lags sollen damit der Vergangenheit angehören. Auch den Video-Encoder NVENC hat Nvidia in der Geforce GTX 980 verbessert und fügt die Unterstützung für H.265 hinzu. Gegenüber Kepler ist es Maxwell nun möglich, H.264-Videos zweieinhalb mal schneller zu kodieren, womit beispielsweise auch 4K mit 60 Bildern pro Sekunde möglich ist. In Nvidias Bildschirmaufnahmeprogramm „Shadowplay“ (Bestandteil von Geforce Experience) wird dieses Feature bereits genutzt. Shadowplay ist deshalb für Let’s-Player interessant, da die Technik die Rechenpower der GPU für die Aufnahmen nutzt und im Vergleich zu anderen Screen-Capturing-Tools nur wenig Leistung beansprucht.

Nvidia hat mit Gameworks eine eigene Entwicklerschmiede für neue Techniken und Features. Viele bekannte Spielestudios setzen bereits viele Nvidia-Techniken ein.
Vergrößern Nvidia hat mit Gameworks eine eigene Entwicklerschmiede für neue Techniken und Features. Viele bekannte Spielestudios setzen bereits viele Nvidia-Techniken ein.
© Nvidia

Unter Nvidia Gameworks möchte der Chip-Hersteller das Gaming auf Windows und Android vorantreiben, indem das Unternehmen dort mit rund 300 Ingenieuren an neuen Grafik-Techniken arbeitet und Entwickler-Tools für die Spielebranche bereitstellt. Features wie HBAO+ (Horizon Based Ambient Occlusion), PhysX, Hairworks oder TXAA entstanden dort unter anderem. Spiele wie Assassin’s Creed: Unity, The Witcher 3 oder War Thunder nutzen eine Vielzahl dieser Nvidia-Techniken. Mit Maxwell kommen gleichzeitig auch neue Features wie Destruction (Zerstörungs-Physik), Turf Effects (realistischere Gras-Animation) und PhysX Flex, das Flüssigkeiten besser darstellen soll.

Apropos Android: Mit der Shield-Plattform und dem mobilen Prozessor Tegra K1 möchte Nvidia auch auf dem mobilen Betriebssystem vertreten sein und ein entsprechendes Gaming-Erlebnis wie auf dem Desktop bieten. Das erst kürzlich erschienene „Shield Tablet“ ermöglicht neben einer Menge Grafikpower auch das Spiele-Streaming vom PC, der mit einer Geforce-GTX-Grafikkarte ab dem Modell GTX 650 ausgestattet sein muss (zum Test des Nvidia Shield Tablet). Übrigens sind die Grafikkarten der GTX-900-Serie voll kompatibel mit DirectX 12.

Nvidia mischt auch bei Virtual Reality mit

Mit der VR-Brille Oculus Rift ist der Virtual-Reality-Zug so richtig ins Rollen gekommen, sodass auch Hersteller wie Google oder Samsung eigene Geräte vorstellen. Zu den größten Problemen der aktuellen VR-Generation zählt allerdings die Latenz, also die Zeit zwischen der Kopfbewegung des Spielers und der Umsetzung im Programm. Bisher beträgt diese Latenz rund 50 Millisekunden (siehe Bild). Um diese Zeit zu reduzieren, setzt Nvidia unter anderem seine neue Kantenglättung MFAA ein und eine neue Technik namens „Asynchronous Warp“. Anstelle jedes Bild von neuem zu rendern, nimmt die Technik die letzte Szene und aktualisiert sie auf die aktuelle Kopfposition und wirft es erst sehr spät in die Pipeline, um die Verzögerung zu minimieren. Auf diese Weise halbiert der Hersteller die Latenz um 50 Prozent und erreicht nur noch 25 Millisekunden.

Mit der Technik "Asynchronous Warp" reduziert Nvidia die Latenzen bei Virtual-Reality-Anwendungen drastisch.
Vergrößern Mit der Technik "Asynchronous Warp" reduziert Nvidia die Latenzen bei Virtual-Reality-Anwendungen drastisch.
© Nvidia

Neu sind auch VR-kompatible Profile für SLI-Systeme. Denn bisher setzt sein Geforce-Grafikkarten-Verbund auf alternatives Frame-Rendering (AFR), bei der die GPUs abwechselnd einen Frame berechnen, was bei Virtual Reality von Nachteil ist, da es hier auf besonders hohe Bildraten ankommt. Bei den neuen Profilen steht nun je eine GPU für je ein Auge respektive eine Display-Seite dediziert zur Verfügung. Zusätzlich packt Nvidia noch DSR für eine bessere Auflösung hinein und will alle 3D-Vision-kompatiblen Anwendungen und Spiele auch fit für VR machen. Auch Geforce Experience soll bald Grafikeinstellungen für die Darstellung auf VR-Geräten beherrschen.

0 Kommentare zu diesem Artikel
1994424