1952087

AMD vs Intel - Moderne CPUs unter der Haube

20.06.2014 | 09:15 Uhr |

Wir stellen die aktuellen CPU-Architekturen von AMD und Intel im Detail vor, erklären zentrale Funktionseinheiten, entschlüsseln Fachchinesisch und zeigen die Vor- und Nachteile der unterschiedlichen Technologien.

Moderne Prozessoren sind inzwischen hochintegrierte Chips, die mehrere Funktionseinheiten, Datenleitungen und Peripherie-Controller in einem Halbleiterbaustein vereinen. Die Hersteller bezeichnen ihre aktuellen Prozessoren mittlerweile berechtigterweise
als System auf einem Chip. Neben einer kostengünstigeren Produktion bieten die komplexen Chips auch handfeste Vorteile: Denn im Vergleich zu Plattformen mit mehreren Halbleiterbausteinen ermöglichen die räumliche Nähe der Rechenwerke und Controller sowie das Architekturdesign aus einer Hand ein energieeffizientes Zusammenspiel sämtlicher Einheiten. Darüber hinaus sind kompaktere und leichtere Gehäusedesigns mit nur einem Chip leichter zu realisieren und einfacher zu kühlen.

AMD verwendet für seine x86-Prozessoren die Bezeichnung Accelerated Processing Unit (APU). Moderne AMD-APUs bestehen aus dem Hauptprozessor mit 2, 4 oder 8 Rechenkernen, einem großen mehrstufigen Cache und einer meist sehr leistungsfähigen Grafiklogik. Hinzu kommen Datenleitungen für eine direkte Anbindung des Speichers und der Bildschirme per PCI-Express sowie moderne Peripherie-Controller wie SATA 3 und USB 3.0.

Bei Intel ist der Grad der Integration vergleichbar weit fortgeschritten, der Chipriese spricht aber nach wie vor von einem Prozessor beziehungsweise der Central Processing Unit (CPU). Intel vereint unter der CPU-Haube seiner aktuellen PC-Prozessoren zwei, vier oder sechs CPU-Kerne, die Speicher- und Displayanbindung, einen Grafikchip und einen großen gemeinsamen Pufferspeicher.

CPU-Z: Analyse-Tool für Ihren Prozessor

System in einem Chip: Moderne Prozessoren packen so unterschiedliche Funktionseinheiten wie CPU, Grafiklogik, Datenleitungen und Controller inzwischen in einen einzigen Halbleiterbaustein.
Vergrößern System in einem Chip: Moderne Prozessoren packen so unterschiedliche Funktionseinheiten wie CPU, Grafiklogik, Datenleitungen und Controller inzwischen in einen einzigen Halbleiterbaustein.

Prozessorfertigung: Transistorgröße und Anzahl der Schaltkreise

Bei der Prozessorfertigung spielen neben der CPU-Architektur auch die Transistorgröße und -anzahl eine wichtige Rolle. Je kleiner die sogenannte Strukturbreite eines Schaltkreises ist, desto mehr Rechenleistung kann der CPU-Hersteller theoretisch pro Watt herausholen. Und je mehr Transistoren, desto höher sollte im Idealfall auch die Rechenleistung sein. Aufgrund der langjährigen Erfahrung – Intel hat mit dem 4004 im Jahre 1971 den Mikroprozessor quasi erfunden – und der Monopolstellung bei PC-Prozessoren mit einem Marktanteil von über 80 Prozent ist Intel bei der Fertigungstechnik AMD immer eine Generation voraus.

Kein Wunder, schließlich ist der Forschungs- und Entwicklungsetat von Intel beinahe doppelt so hoch wie der Jahresumsatz von AMD. Darum versucht AMD das durch mehr Transistoren auszugleichen, wie ein Vergleich der aktuellen Prozessorgenerationen AMD Kaveri und Intel Haswell zeigt: Die Anfang 2014 vorgestellte Baureihe AMD Kaveri produziert der taiwanische Auftragsfertiger TSMC im 28-Nanometer-Verfahren. Das Siliziumplättchen (Die) nimmt 245 Quadratmillimeter ein. Die Anzahl der Transistoren beträgt rund 2,4 Milliarden. Im Vergleich zu den 32-nm-Vorgängern Richland und Trinity mit nahezu 1,3 Milliarden Schaltkreisen auf knapp 265 Quadratmillimetern wächst beim Kaveri die Anzahl der Transistoren um fast 90 Prozent. Das Siliziumplättchen der Mitte 2013 eingeführten Prozessorgeneration Haswell stellt Intel im hauseigenen 22-Nanometer-Verfahren her. Die Fläche ist im Vergleich zum 22-nm-Vorgänger Ivy Bridge von 160 auf 177 Quadratmillimeter gewachsen. Auf dieser Fläche bringt Intel 1,4 Milliarden Schaltkreise unter.

Je kleiner die Strukturbreite, desto mehr CPUs passen auf einen Halbleiterrohling und desto kostengünstiger ist die Fertigung. Aus dem 300-Millimeter-Wafer hier im Bild lassen sich über 500 Prozessoren herausschneiden.
Vergrößern Je kleiner die Strukturbreite, desto mehr CPUs passen auf einen Halbleiterrohling und desto kostengünstiger ist die Fertigung. Aus dem 300-Millimeter-Wafer hier im Bild lassen sich über 500 Prozessoren herausschneiden.

AMD Kaveri versus Intel Haswell: Architektur im Detail

Die Besonderheit des Kaveri ist seine heterogene Systemarchitektur (HSA), mit der AMD das Zusammenspiel zwischen Prozessor- und Grafikkernen ganz eng verzahnt, um die Recheneffizienz der APU deutlich zu steigern. Die entscheidende Rolle bei der HSA spielt der gemeinsame Speicherzugriff (Shared System Memory) der Prozessor- und Grafikeinheiten über einen kollektiven genutzten Adressraum (Heterogeneous Uniform Memory Access). So können alle Prozessor- und Grafikkerne jederzeit auf die berechneten und zwischengespeicherten Daten aller anderen Kerne zugreifen. Dazu muss AMD mit einem Dogma brechen: Bislang steuerte der Prozessor den Programmablauf. In der HSA darf jetzt auch der in C++ und Open CL C programmierbare Grafikprozessor der CPU die Durchführung von Berechnungen vorgeben.

AMD nennt diese Technik, die Wartezeiten bei der Datenverarbeitung zwischen CPU und GPU auf ein Minimum beschränken soll, Heterogeneous Queuing (HQ). Die Vorteile dieses gleichberechtigten Arbeitens liegen auf der Hand: Jede Einheit kann dann für die Berechnung eingesetzt werden, die sie am besten beherrscht. So liegen die Stärken der CPU-Kerne eher in seriellen Berechnungen, während sich die Grafikkerne aufgrund ihrer zahlreichen Gleitkomma-Einheiten (FPU) besser für parallele Berechnungen eignen. Zudem weiß so jede Recheneinheit, was die andere gerade tut und kann direkt auf Zwischen- und Endergebnisse von Berechnungen zugreifen, die sie vielleicht selber für ihre Aufgaben benötigt.

Der Kaveri-Prozessor fasst in einem Steamroller-Modul zwei CPU-Kerne zusammen.
Vergrößern Der Kaveri-Prozessor fasst in einem Steamroller-Modul zwei CPU-Kerne zusammen.
© AMD

Bei den Prozessorkernen kommt zum ersten Mal die Steamroller-Architektur zum Zuge, bei der es sich im Prinzip um eine zweite Optimierung der Bulldozer-Kerne handelt, die bereits in den Desktop-FX-CPUs Ende 2011 ihr Debut feierten. Charakteristisch für die Architektur ist der modulare Aufbau: Ein Modul entspricht zwei logischen Prozessorkernen und besteht aus zwei 128-Bit-Gleitkomma-Einheiten sowie zwei Integer-Einheiten mit jeweils zwei arithmetisch-logischen Einheiten (ALU) und zwei Adressengenerierungseinheiten (AGU). Rechenergebnisse puffern alle Einheiten in einem gemeinsam genutzten L2-Cache.

AMDs heterogene Systemarchitektur (HSA): Die Grafikkerne kümmern sich hauptsächlich um parallele und die CPU-Kerne um serielle Berechnungen. Ergebnisse können alle Kerne jederzeit über den Speicher austauschen.
Vergrößern AMDs heterogene Systemarchitektur (HSA): Die Grafikkerne kümmern sich hauptsächlich um parallele und die CPU-Kerne um serielle Berechnungen. Ergebnisse können alle Kerne jederzeit über den Speicher austauschen.
© AMD

Die aktuelle vierte Core-Generation von Intel mit dem Codenamen Haswell feierte Mitte 2013 Premiere. Auch der Haswell ist eine zum zweiten Mal überarbeitete und optimierte Version der bereits Anfang 2011 vorgestellten Prozessorgeneration Sandy Bridge. Charakteristisches Merkmal ist die Ringarchitektur: Die CPU-Kerne, die integrierte Grafiklogik und der System Agent tauschen Daten über einen gemeinsamen Last-Level-Cache (LLC) aus, der sämtliche Einheiten über einen unidirektionalen Ringbus verbindet.

Bei der aktuellen Generation Haswell steckt Intel ungefähr ein Drittel der insgesamt 1,4 Millionen Transistoren in die integrierte Grafiklogik (roter Bereich links). Den Löwenanteil nehmen nach wie vor die CPU-Kerne und der Cache ein.
Vergrößern Bei der aktuellen Generation Haswell steckt Intel ungefähr ein Drittel der insgesamt 1,4 Millionen Transistoren in die integrierte Grafiklogik (roter Bereich links). Den Löwenanteil nehmen nach wie vor die CPU-Kerne und der Cache ein.
© Intel

Im Vergleich zum Urahnen besitzt der Haswell allerdings knapp 50 Prozent mehr Transistoren, die Intel überwiegend in den Ausbau der integrierten Grafiklogik investiert. Zusätzliche Schaltkreise steckt Intel jedoch auch in mehr Ausführungseinheiten sowie in einen größeren Pufferspeicher: Im Vergleich zum Vorgänger Ivy Bridge besitzt der Haswell statt drei nun vier Integer-Einheiten, die aus jeweils einer ALU und einer AGU bestehen, während sich die letzte Cache-Stufe auf bis zu 8 MB vergrößert.

Gleichzeitig führt Intel mit dem Haswell neue Erweiterungen des x86-Befehlssatzes ein. So sorgen beispielsweise die Advanced Vector Extensions 2 (AVX2) mit ihren 256-Bit-Vektoren im Vergleich zur ersten AVX-Version sowohl bei einfacher als auch doppelter Präzision für den doppelten Befehlsdurchsatz. Das kann, sofern Programme auf AVX2 optimiert sind, die Recheneffizienz des Haswell um bis zu 60 Prozent beschleunigen – etwa bei Multimedia-Anwendungen oder bei der Datenverschlüsselung. Und die Spannungsversorgung des Prozessors überlässt Intel auch nicht mehr der Hauptplatine, sondern bündelt sie in einem voll in der CPU integrierten Spannungsregler. Dies sorgt bei extremen Schwankungen der Leistungsaufnahme, wie sie beispielsweise typisch für den Wechsel vom Standby- in den Betriebsmodus sind, für eine höhere Energieeffizienz.

AMD-CPU-Upgrade leicht gemacht

Für den CPU-Sockel FM2+ mit 904 Signalkontakten hat AMD die Kaveri-Baureihe konzipiert. Aktuell umfasst sie lediglich vier Varianten.
Vergrößern Für den CPU-Sockel FM2+ mit 904 Signalkontakten hat AMD die Kaveri-Baureihe konzipiert. Aktuell umfasst sie lediglich vier Varianten.
© AMD

Die integrierte Grafiklogik wird immer wichtiger

Nahezu 50 Prozent aller Transistoren des Kaveri nutzt AMD für die integrierte Grafiklogik. Beim Haswell von Intel sind es immerhin schon gut 30 Prozent. Dafür bietet Intel gleich sieben verschiedene Grafikprozessoren an, seinem Spitzenmodell Iris Pro Graphics 5200 spendiert Intel sogar einen 128 MB großen integrierten Videospeicher. Beim Kaveri führt AMD auch eine neue Grafikprozessor-Architektur ein und wechselt von der ineffizienten Technik Very Long Instruction Word (VLIW) auf die moderne Graphic Core Next (GCN), die AMD seit der Baureihe Radeon HD 7000 bereits für Grafikkarten verwendet. Die GNC-Architektur ist auf die parallele Abarbeitung von Berechnungen spezialisiert und fasst jeweils 4 SIMD und 16 ALUs in einem Shader-Cluster zusammen. Gemeinsam mit den vier nachfolgenden TMUs bildet der Cluster einen Compute-Core des Grafikprozessors. Der Grafikprozessor des Kaveri besitzt acht Compute-Cores mit, je nach Modell, maximal 512 Shader-Prozessoren, die über ein 128 Bit breites Speicher-Interface angeschlossen sind. Konzipiert ist das Interface für RAM-Geschwindigkeiten von DDR3-2133, schnellerer Speicher ist allerdings auch kein Problem. Im Gegenteil: je schneller, desto besser, denn schließlich fungiert der Arbeitsspeicher zudem als Videospeicher. Wie die aktuelle Grafikkartengeneration unterstützt auch die Grafiklogik des Kaveri DirectX 11.2, Open CL, Open GL 4.3, PCI Express 3.0, die hauseigene Programmierschnittstelle Mantle und die Technik Dual Graphics. Außerdem bringt der Grafikprozessor einen leistungsfähigen Videodecoder und -encoder mit und beherrscht die Bildausgabe über Displayport 1.2, DVI, HDMI 1.4a und VGA.

Der Kaveri-Prozessor fasst in einem Steamroller-Modul zwei CPU-Kerne zusammen.
Vergrößern Der Kaveri-Prozessor fasst in einem Steamroller-Modul zwei CPU-Kerne zusammen.
© AMD

Bei der vierten Core-Generation hat Intel den Schwerpunkt auf eine deutlich leistungsfähigere Grafiklogik gelegt. Das zeigt schon allein die große Auswahl: sage und schreibe sieben Varianten hat der Prozessorgigant in seiner Haswell-Serie verbaut. Gemeinsam ist allen Versionen die Unterstützung der Bildschirm-Interfaces DVI, Displayport 1.2, HDMI 1.4a, VGA und Wireless Display 4.1 sowie der Programmierschnittstellen DirectX 11.1, Open CL 1.2 und Open GL 4.0. Das De- und Encodieren von Videos übernimmt der Hardware-Transcoder Intel Quick Sync Video. In den Desktop-CPUs verbaut Intel nur die Varianten HD Graphics und HD Graphics 4400 sowie 4600, die schnellsten Modelle mit der Bezeichnung Iris Graphics sind den Notebook-Prozessoren vorbehalten. Die Leistungsspanne der Haswell-Grafiklogik reicht vom Spitzenmodell Iris Pro Graphics 5200 mit 40 Ausführungseinheiten (AE) und einem Takt von 1300 MHz bis zur 200 bis 1000 MHz schnellen Einsteigervariante HD Graphics mit 10 AEs.

Grafikprozessoren der Haswell-CPU im Überblick.
Vergrößern Grafikprozessoren der Haswell-CPU im Überblick.

Rechenleistung von Kaveri und Haswell im direkten Vergleich

Obwohl AMD mit dem Kaveri momentan den komplexesten PC-Prozessor baut, rechnet dieser nicht unbedingt schneller als eine Haswell-CPU. Denn am Ende des Tages bestimmt das Gesamtpaket aus Architektur, Fertigungstechnik, Takt, Anzahl der Ausführungseinheiten und Features wie etwa Befehlssatzerweiterungen sowie das Zusammenspiel der einzelnen Funktionseinheiten, wie leistungsfähig ein Prozessor tatsächlich ist. Und natürlich haben die unterschiedlichen technischen Ansätze von AMD und Intel zwangsläufig auch unterschiedliche Stärken und Schwächen. Aber welches Kaveri-Modell lässt sich mit welcher Haswell-Variante fair vergleichen? Da es hier keine eindeutig objektive Lösung gibt, haben wir die beiden Architekturen jeweils hinsichtlich ihrer Leistungsaufnahme und ihres Anschaffungspreises verglichen.

Beim Stromverbrauch kann man den AMD A8-7600 (vier Kerne mit 3,3 GHz, 110 Euro) recht gut mit dem Intel Core i3-4130 (zwei Kerne mit 3,4 GHz, 90 Euro) vergleichen: Ähnlich ausgestattete Testplattformen mit den beiden Prozessoren verbrauchen im Leerlauf etwa 35 bis 40 Watt, jedoch unter Last klettert die Leistungsaufnahme auf 75 bis 80 Watt. Bei der CPU-Leistung hat der Haswell-Prozessor – obwohl er nur über zwei CPU-Kerne verfügt – die Nase vorn und rechnet im Schnitt 20 Prozent schneller. Bei der Grafikleistung hängt die AMD-CPU den mit einer HD Graphics 4400 ausgestatteten Intel-Prozessor deutlich ab und ist bis zu 60 Prozent schneller.

Für knapp 150 Euro ist sowohl der AMD A10-7850K (vier Kerne mit 3,7 GHz, TDP: 95 Watt) als auch der Intel Core i5-4440 (vier Kerne mit 3,1 GHz, TDP: 84 Watt) zu haben. Einen klaren Vorsprung holt das Intel-Modell bei der CPU-Leistung heraus: Gegenüber dem deutlich höher getakteten AMD-Rivalen beträgt der Vorsprung je nach Benchmark bis zu 50 Prozent. Ganz anders sieht es wiederum bei der Grafikleistung aus. Hier packt der AMD-Prozessor in PC-Spielen im Idealfall nahezu doppelt so hohe Bildraten wie der Haswell-Prozessor mit der Intel HD Graphics 4600.

Der Haswell-Prozessor besitzt 1150 Signalkontakte und kommt in Dutzenden von Varianten vom 30-Euro-Celeron bis zum zehnmal so teuren Spitzenmodell Intel Core i7-4770K vor.
Vergrößern Der Haswell-Prozessor besitzt 1150 Signalkontakte und kommt in Dutzenden von Varianten vom 30-Euro-Celeron bis zum zehnmal so teuren Spitzenmodell Intel Core i7-4770K vor.
© Intel

Fazit: Intel baut die bessere CPU, AMD die bessere APU

Mit Kaveri hat AMD eine gut ausbalancierte APU entwickelt. Das Zusammenspiel aus CPU und Grafikprozessor macht die Kaveri-Baureihe zu einem Chip, der typischen Multimedia-Aufgaben gewachsen ist, aber auch Gelegenheitsspieler zufriedenstellt, die grafisch aufwendige Spiele nicht unbedingt in Top-Bildqualität genießen müssen. Wer mit mehreren Programmen gleichzeitig arbeitet, regelmäßig Videos bearbeitet, schneidet und transcodiert und damit also vor allem CPU-Leistung braucht, der ist mit einem Haswell-Modell besser bedient. Außerdem arbeiten die Intel-Prozessoren wegen der fortschrittlicheren Fertigungstechnik energieeffizienter, sie holen daher pro Watt mehr Rechenleistung aus ihren Schaltkreisen heraus. Zu einem Quadcore-Haswell mit Taktraten ab 3 GHz raten wir Ihnen auch, wenn Sie regelmäßig grafisch anspruchsvolle Games spielen. So stellen Sie sicher, dass die vielleicht doppelt so teure Grafikkarte nicht vom Prozessor ausgebremst wird.

0 Kommentare zu diesem Artikel
1952087