2041960

Nvidia bestätigt falsche Angaben bei GTX-970-Grafikkarten

25.02.2015 | 09:26 Uhr |

Update vom 25. Februar 2015: Nvidia-CEO äußert sich offiziell zur GTX 970. - Nach zahlreichen Mutmaßungen nun die offizielle Bestätigung von Nvidia zur Speicher-Problematik bei der Geforce GTX 970: Die GPU adressiert nur 3,5 des insgesamt 4 GB großen Grafikspeichers performant an, des Weiteren fällt auch der Level-2-Cache kleiner aus und auch die Anzahl der ROPs (Raster Operation Processor) ist geringer als angegeben.

Update vom 25. Februar 2015 - Nvidia-CEO Jen-Hsun Huang äußert sich zu den falschen Angaben bei der Geforce GTX 970: Nvidias oberster Chef Jen-Hsun Huang  hat sich nun in einem Beitrag auf dem offiziellen Nvidia-Blog zur Speicherproblematik der GTX 970 geäußert.

Er verstehe die Enttäuschung und möchte nun für Aufklärung sorgen: "Die neue Speicherarchitektur innerhalb von Maxwell ermöglicht es auch den leistungsreduzierteren Maxwell-GPUs einen größeren Framebuffer zu nutzen - deshalb stieg der Speicher der GTX 970 von 3 auf 4 GB."

Er betont weiterhin, dass es sich bei der GTX 970 definitiv um eine 4-GB-Grafikkarte handelt. Allerdings seien 512 MB der zusätzlichen 1-GB-Speichers nur mit einer reduzierten Bandbreite ansprechbar. Huang hält das für ein "gutes Design", denn so war Nvidia in der Lage weitere 1 GB Speicher hinzuzufügen, während die Software-Ingenieure dafür sorgen, selten genutzte Daten in das langsamere Segment auszulagern. Huang weiter: "Leider haben wir es versäumt diesen Umstand sowohl intern unserem Marketing-Team, als auch extern den Testern bei Veröffentlichung mitzuteilen."

"Seitdem veröffentlichte Jonah Alben, der Senior Vice President der Hardware-Entwicklung bei Nvidia, eine technische Beschreibung des Speicher-Designs, das von vielen Journalisten akzeptiert wurde." [siehe weiter unten in diesem Artikel] Weiterhin zeigt sich der Nvidia-CEO verständnisvoll darüber, dass die Speicherarchitektur nicht besser beschrieben wurde. Denn seiner Ansicht nach hatte Nvidia stets die Absicht, die beste GPU herzustellen und die GTX 970 mit 4 GB Speicher auszustatten - schließlich steige der Speicherbedarf bei Spielen immer weiter.

Jen-Hsun Huang schließt sein Statement damit ab, dass so etwas nicht mehr passieren werde und Nvidia das nächste Mal einen "besseren Job" macht. Allerdings trägt dieser Beitrag unserer Meinung nach nicht sonderlich dazu bei, die erhitzten Gemüter vieler GTX-970-Besitzer zu besänftigen. Des Weiteren geht der Nvidia-Chef mit keinem Wort auf die restlichen falschen Angaben ein, also bei der Kapazität des Level-2-Caches und der Anzahl der ROPs. Auch von einer Art Kompensation ist keine Spur. Mittlerweile muss sich Nvidia wohl auch einer Sammelklage in den USA stellen. Wir berichten weiter an dieser Stelle, wie es mit der Problematik rund um die GTX 970 weiter geht.

Usprünglicher Beitrag vom 28. Januar 2015:

Eigentlich verfügt die Geforce GTX 970 auf dem Datenblatt über satte 4 GB Grafikspeicher. Doch nachdem bereits in mehreren Foren und auf zahlreichen Seiten über den Grafikspeicher der Geforce GTX 970 diskutiert wurde, warum sich die Grafikkarte bei einer Speicher-Auslastung von 3,5 bis 4 GB seltsam verhält, hat Nvidia nun ein offizielles Statement abgegeben.

Gigabyte GTX 970 G1 Gaming OC im Test

Offizielles Statement von Nvidia zur GTX 970

[Nvidia]: „Die Geforce GTX 970 ist mit 4 GB dedizierten Grafikspeicher ausgestattet. Jedoch verfügt die 970 über einen unterschiedlichen Aufbau an SMs (Streaming-Multiprozessoren) als die 980 sowie über weniger Crossbar-Ressourchen für das Speicher-System. Um in dieser Konfiguration die Speicherzugriffe optimal zu steuern, haben wir den Speicher in eine 3,5 sowie in eine 0,5 GB große Sektion aufgeteilt. Die GPU greift mit höherer Priorität auf die 3,5-GB-Sektion zu. Wenn also ein Spiel weniger als 3,5 GB Grafikspeicher benötigt, wird es nur die erste Partition ansprechen, während Drittanbieter-Software zur Messung der Speicher-Auslastung angeben wird, dass in der GTX 970 nur 3,5 GB Speicher in Benutzung sind. In einer GTX 980 jedoch könnten diese Tools mehr Speicher anzeigen, wenn mehr Kapazität genutzt wird. Erst wenn ein Spiel mehr als 3,5 GB Speicher benötigt, nutzen wir beide Sektionen.

Wir verstehen, dass es einige Fragen darüber gab, wie sich die GTX 970 in Sachen Leistung verhält, wenn sie das 0,5 GB große Speicher-Segment nutzt. Der beste Weg, um das herauszufinden, ist sich die Spiele-Leistung anzusehen. Vergleichen Sie eine GTX 980 mit einer GTX 970 wenn ein Spiel weniger als 3,5 GB Speicher nutzt. Dann drehen Sie die Einstellungen so hoch, dass das Spiel mehr als 3,5 GB Speicher benötigt, und vergleichen Sie anschließen wieder die Leistung miteinander.“

Nvidia hat die besagten Tests intern durchgeführt und eine entsprechende Tabelle veröffentlicht, die nun folgt:

Bildraten-Vergleich bei mehr als 3,5-GB-Speicherauslastung

GTX980

GTX970

Shadows of Mordor

<3.5GB setting = 2688x1512 Sehr hohe Details

72 Bilder/s

60 Bilder/s

>3.5GB setting = 3456x1944

55 Bilder/s (-24%)

45 Bilder/s (-25%)

Battlefield 4

<3.5GB setting = 3840x2160 2x MSAA

36 Bilder/s

30 Bilder/s

>3.5GB setting = 3840x2160 135% Auflösung

19 Bilder/s (-47%)

15 Bilder/s (-50%)

Call of Duty: Advanced Warfare

<3.5GB setting = 3840x2160 FSMAA T2x, Supersampling aus

82 Bilder/s

71 Bilder/s

>3.5GB setting = 3840x2160 FSMAA T2x, Supersampling an

48 Bilder/s (-41%)

40 Bilder/s (-44%)

[Nvidia]: „[…]Wie Sie sehen können, ergeben sich in diesen Spielen nur sehr kleine Änderungen im Vergleich zwischen der GT 970 und der GTX 980, wenn die Spiele auch noch das 0,5-GB-Segment der GTX 970 nutzen.“

So ändern sich die Spezifikationen der GTX 970

Zusammengefasst lässt sich also folgendes sagen: Ja, über 500 MB des 4-GB-Grafikspeichers spricht der Grafikprozessor etwas langsamer an als die restlichen 3,5 GB. Und auch die Anzahl der für die Bildsynthese verantwortlichen Raster Operations Processors (ROPs) beträgt anstelle von 64 doch nur 56. Hinzu kommt noch, dass auch der Level-2-Cache nur 1792 anstelle von 2048 KB groß ist.

Realistische Auswirkungen auf die Praxis-Leistung in den meisten Spielen oder Multimedia-Tools hat das allerdings kaum. Denn in der Praxis verhindert in der Regel der Treiber, dass Anwendungen mehr als 3,5 GB bei der GTX 970 nutzen. Hinzu kommt, dass sich der Leistungs-Unterschied bei der Nutzung beider Speicher-Segmente nur im einstelligen Prozentbereich bewegt. Die korrekten Spezifikationen des GM204-Chips innerhalb der Geforce GTX 970 lauten nun folgendermaßen:

Grafikkarten-Oberklasse: Technische Daten

Nvidia Geforce GTX 970 (alt)

Nvidia Geforce GTX 970 (neu)

Nvidia Geforce GTX 980

Grafikchip

GM204

GM204

GM204

Fertigung

28 Nanometer

Chipfläche

398 mm²

398 mm²

398 mm²

GPU-Standard-Takt / Boost-Takt

1050 / 1178 MHz

1050 / 1178 MHz

1127 / 1216 MHz

Shader-Einheiten

1664

1664

2048

TMUs

104

104

128

ROPs

64

56

64

GDDR5-Speicher

4096 MB

4096 (3584 + 512) MB

4096 MB

Speichertakt (effektiv)

7000 MHz

7000 MHz

7000 MHz

Speicheranbindung

256 Bit

224 + 32 Bit

256 Bit

Speicherbandbreite

224 GB/s

196 + 28 GB/s

224 GB/s

Level-2-Cache

2048 KB

1792 KB

2048 KB

Streaming-Multiprozessoren (SM)

13

13

16

Nvidia bemüht sich um Aufklärung

Nvidias Senior Vice President der GPU-Engineering-Sparte, Jonah Alben, hat sich dem Problem angenommen und ein Interview mit der englischen Seite PC-Perspective geführt. Um die Problematik etwas genauer zu beleuchten, hat Alben auch ein Diagramm des Speicher-Systems der GTX 970 angefertigt, welches Sie weiter unten sehen können: An der Spitze befinden sich die 13 aktiven SMs der GM204-Variante der GTX 970, die ausgegrauten Blöcke stehen für die inaktiven SMs. Jeder aktive SM verfügt über 128 Cuda-Shader-Einheiten.

Das Speicher-System der GTX 970 im Detail: Rechts unter der Crossbar sehen Sie den inaktiven achten Port und Level-2-Cache.
Vergrößern Das Speicher-System der GTX 970 im Detail: Rechts unter der Crossbar sehen Sie den inaktiven achten Port und Level-2-Cache.
© Nvidia

Die Streaming-Multiprozessoren greifen über eine sogenannte Crossbar-Schnittstelle auf den Speicher zu. Die Crossbar selbst greift im Vollausbau eines GM204-Chips (also beispielsweise bei einer GTX 980) über insgesamt acht Ports (Anschlüsse) auf den Level-2-Cache sowie die Speicher-Controller zu. Allerdings fehlt bei einer GTX 970 genau einer dieser Ports, was Auswirkungen auf die Kapazität des Caches und die Anzahl der ROPs hat – hier spricht Nvidia allerdings von Missverständnissen in der Kommunikation zwischen dem Ingenieurs- und technischen PR-Team.

Nvidia Geforce GTX 980 im Test

Doch weiter zum Kern des Problems: Jedem der acht Blöcke aus Level-2-Cache und ROPs stehen 32 Bit des insgesamt 256 Bit großen Speicher-Interfaces zu Verfügung, die an 512 MB Grafikspeicher angebunden sind. Dank der neuen Maxwell-Architektur lassen sich bestimmte Bereiche des Level-2-Caches und ROPs deaktivieren, ohne dabei die Größe des Speicher-Interfaces einzuschränken.

Aufteilung des VRAMs in zwei Speicherblöcke

Während es also der GTX 980 möglich ist, die Speicherzugriffe gleichmäßig über die komplette Breite des Speicher-Interfaces aufzuteilen, muss die GTX 970 etwas anders an die Sache herangehen: Der vorhin erwähnte siebte und letzte aktive Port zwischen der Crossbar-Schnittstelle ist nun für die doppelte Speichermenge zuständig, da ihm auch zwei Speicherblöcke anhängen. In der Theorie müssten die anderen sechs Ports nun immer auf den siebten Port warten, bis dieser die Anfragen komplett abgearbeitet hat.

Um aber einen dramatischen Einbruch der Speicherbandbreite zu vermeiden, hat Nvidia den Grafikspeicher in zwei Blöcke aufgeteilt, einmal mit einer Kapazität von 3584 und einmal mit 512 MB. Während das Crossbar-Interface die 3,5 GB gleichmäßig ansprechen kann, erfolgt bei Speicheranforderungen jenseits der 3,5 GB auch der Zugriff auf den langsameren 512 MB großen Speicherbereich.

Käufer der Nvidia Geforce GTX 970 verärgert

Nichtsdestotrotz verfügt die GTX 970 tatsächlich über 4 GB Grafikspeicher. Es lässt sich allerdings darüber streiten, ob Nvidia angeben sollte, dass die GPU in der Regel nur 3,5 GB mit voller Bandbreite anspricht. Tatsächlich lässt sich Nvidia allerdings vorwerfen, die Fachpresse nicht über die falschen Angaben bezüglich des L-2-Caches und der ROPs aufgeklärt zu haben, genau wie über die Aufteilung des Grafikspeichers.

Klar ist, dass viele Käufer einer GTX 970 verärgert reagieren und von nachträglicher Preisminderung bis hin zu arglistiger Täuschung reden. Doch in der Praxis ist die GTX 970 deswegen auch nicht langsamer, sondern macht seinen Job gewohnt gut. Auch die Speicher-Aufteilung ist nicht wirklich neu, bereits bei der GTX 550 Ti und 660 Ti setzte der Hersteller eine ähnliche Technik ein.

0 Kommentare zu diesem Artikel
2041960