Freie Fahrt: Hohe Intra-Chip-Bandbreiten erlauben eine effektive Nutzung der Komponenten. (Quelle: IBM)
Der Cell-Multi-Core-Chip verfügt insgesamt über 2,5 MByte schnellen SRAM-Speicher. Der Power-Steuerkern besitzt einen 32 KByte großen L1-Cache für Daten und Befehle sowie 512 KByte L2-Cache. Daneben gibt es jeweils 256 KByte lokalen Speicher für Daten und Instruktionen pro SPE.
Die lokalen Speicher jeder SPE sind nacheinander in den Adressraum der PPE dem Power-Kern gemappt, so dass die PPE direkt darauf zugreifen kann. Der Hauptspeicher in Form von schnellem XDR-DRAM (12,8 GByte/ bei 3,2 GHz Taktfrequenz) wird über ein Dual-Rambus-Interface (XIO je 12,8 GByte/s) an den Memory-Controller angebunden. Pro Kanal können acht unabhängige Speicherbänke mit je 256 MByte adressiert werden.
Off-Chip-Speicherzugriffe erfolgen in 64 Bit über den Memory-Flow-Controller (MFC) in Form einer DMA-Aktion, was einen theoretischen Zugriff auf 264 Byte ermöglichen würde, jedoch wird dies zurzeit nicht genutzt. Der Zugriff auf den lokalen Speicher der SPEs erfolgt mit 32 Bit, womit also maximal 4 GByte adressiert werden können.
Über den MFC kann auch auf nicht eigenen lokalen Speicher zugegriffen werden. Es können für jede SPE 128 gleichzeitige Transaktionen zwischen Speicher und Prozessor stattfinden. Auf den L1- und L2Cache sowie den lokalen Speicher der SPEs kann maximal mit 51,2 GByte/s zugegriffen werden.
Der Zugriff auf den Hauptspeicher erfolgt mit der halben Bandbreite maximal 25,6 GByte/s. Mit dieser Datenrate sind auch alle Komponenten an den internen Bus angebunden. Der integrierte mit 5 GHz betriebene I/O Controller bietet mit zwei schnellen Rambus-FlexIO-Schnittstellen eine maximale Datenrate von 25 GByte/s in den Chip und 35 GByte/s aus dem Chip heraus für I/O-Daten.
Der I/O-Controller dient als sogenanntes Broadband-Interface (BIF) zur Vernetzung der Cells untereinander in Mehrprozessorsystemen. Die I/O-Schnittstelle setzt sich aus sieben Sende- und fünf Empfangs-Rambus-Links mit je 1 Byte zusammen. Diese Links können zu zwei logischen Interfaces mit pro-
grammierbarer Datenrate kombiniert werden.
Lesen Sie auf der nächsten Seite:
Lesen Sie in diesem Beitrag