AdvancedTXCA Für beste Leistungsausnutzung

AdvancedTXCA
Für beste Leistungsausnutzung

Multicore-Prozessoren sind heute Standard. Sie haben sich hauptsächlich deshalb durchgesetzt, weil Prozessoren bei typischen Anwendungen etwa 75% der gesamten Betriebszeit mit dem Warten auf Daten verbringen. Bislang sind die Prozessorgeschwindigkeiten stärker gestiegen, als Speicherlatenzen reduziert werden konnten. Zusätzliche CPU-Zyklen können in diesem Zusammenhang nur wenig zur Leistungssteigerung beitragen. Obendrein hat eine Erhöhung der Prozessorfrequenzen den Nachteil eines höheren Energieverbrauchs.

Der Vorteil von Multicore-Prozessoren liegt darin, dass sie eine hohe Gesamtleistung aufweisen, auch wenn die einzelnen Kerne relativ langsam arbeiten (Voraussetzung hierfür ist natürlich, dass Speicher-Subsysteme den parallelen Zugriff auf Daten unterstützen). Der Leistungsanstieg macht sich insbesondere bei Anwendungen bemerkbar, die für die Parallelverarbeitung ausgelegt sind.

Die Vorteile von AdvancedTCA

AdvancedTCA (ATCA) eignet sich für Anwendungen, die Redundanz sowie hohe Zuverlässigkeit erfordern und mehr Prozessorleistung benötigen, als ein 19-Zoll-Rackserver liefern kann. Im Gegensatz zu Servern im ‚Pizzakarton-Format‘ kann ein ATCA-Gehäuse bis zu 14 Blades aufnehmen, die über die Backplane mit Fabric-Switches verbunden werden. Stromversorgung und Kühlung sind ebenfalls im Gehäuse untergebracht. Die Blades werden über die ATCA-Backplane mithilfe einer Fabric-Schnittstelle zur Datenübertragung und einer Base-Schnittstelle zur Steuerung angeschlossen. Der Standard der Datenebene ist heute meist 10Gbit Ethernet, die Entwicklung geht jedoch in raschem Tempo in Richtung 40Gbit Ethernet. Für die Steuerungsebene wird 1Gbit Ethernet verwendet. Beide Schnittstellen können redundant ausgelegt sein, in diesem Fall ist jeder Blade mit beiden ATCA-Hubs/-Switches verbunden. Diese Auslegung macht ATCA-Systeme zuverlässiger und bietet höhere Wartungsfreundlichkeit als externe Verkabelungen. Gleichzeitig erleichtert die Trennung von Steuerungs- und Datenebene das System-Management und spart Bandbreite, die für Mehrwert generierenden Datenverkehr genutzt werden kann. Darüber hinaus stellt diese Trennung eine wichtige Sicherheitsfunktion dar, denn sie verhindert, dass von der Datenebene aus auf die Schnittstellen für das Switch-Management zugegriffen werden kann.

ATCA für rechenintensive Anwendungen

Bei rechenintensiven Anwendungen muss eine große Zahl von Prozessoren mit hohem Durchsatz und geringer Latenz arbeiten. In einem ATCA-Gehäuse bietet Ethernet (10 und 40Gbit) die Voraussetzungen für den erforderlichen Datendurchsatz. Hinzu kommt, dass bestimmte Ethernet-Switches den Pass-Through-Modus unterstützen. Dabei liegt die Switch-Latenz unter 500ns, da die Paketübertragung bereits beginnt, bevor das Paket vollständig empfangen wurde. Auf redundante Verbindungen kann problemlos zugunsten von mehr Bandbreite verzichtet werden. Für rechenintensive Anwendungen, die keine ATCA-Redundanzfunktionen benötigen, ist eine Verdoppelung der Bandbreite des ATCA-Systems möglich. Sie wird durch parallele Nutzung der beiden Hubs (Ethernet-Switches) realisiert. Zudem bietet ATCA eine sehr hohe Rechendichte bei kalkulationsintensiven Anwendungen. Beispiel: Ein ATCA-System mit 14 A10200-Blades, die mit je zwei Intel Westmere 6-Kern-Prozessoren ausgestattet sind, verfügt über insgesamt 168 Kerne innerhalb eines Gehäuses. Sie werden über ein internes High-Speed-Inter­connect miteinander verbunden. Rechenintensive Anwendungen erfordern in der Regel zuverlässige und schnelle Massenspeicher hoher Kapazität. ATCA erfüllt diese Anforderung auf Blade-Ebene durch lokale Festplatten auf den Blades oder auf einem RTM. Darüber hinaus ist innerhalb des Systems der Einsatz spezieller ATCA-Speicherblades möglich, auf die mithilfe von High-Speed-Proto­kollen zugegriffen wird. Je nach Anforderung lässt sich über Fibre Channel, FCoE oder iSCSI ein zusätzlicher externer Speicher-Array anschließen.

ATCA für Kommunikationsanwendungen

Kommunikationsanwendungen erfordern hohen Datendurchsatz und effiziente Paketverarbeitung. Sie profitieren in der Regel besonders stark von Parallelverarbeitung – der ‚Paradedisziplin‘ von Multicore-Prozessoren. Multicore-Prozessoren für allgemeine Anwendungen zeichnen sich durch exzellente Rechenleistung aus, haben demgegenüber jedoch meist Schwächen beim effizienten Datentransport. Für diesen Zweck sind normalerweise Paketprozessoren erste Wahl. Sie bilden eine eigene Klasse von Multicore-Prozessoren, die speziell auf effizienten Pakettransport ausgelegt sind. Paketprozessor-Blades wie unser AT2-5800 mit zwei 16-Kern-OCTEON Plus-Prozessoren sind im ATCA-Blade-Formfaktor erhältlich und ermöglichen Entwicklern, im selben System die Vorteile beider Prozessortypen zu nutzen. Ethernet-Switches (ATCA-Hubs) bieten innerhalb solcher Systeme Vorteile aufgrund ihrer Lastverteilungsfunktionen. Moderne Ethernet-Switches können dank ihrer Access Control List-Funktionen Datenpakete an spezifische ATCA-Blades weiterleiten. Dieses richtlinienbasierte Routing ermöglicht den Pakettransport bei hohen Übertragungsraten von 10 bis 100Gbit/s. Dabei ist sichergestellt, dass Pakete, die zu einem Datenstrom gehören, an denselben Blade übermittelt werden. Ein Hochleistungs-ATCA-Kom­munikationssystem mit zwei Ethernet-Schnittstellen, zwei A10200-Blades und bis zu zwölf Blades mit je zwei 16-Kern-Octeon Plus-Paketprozessoren verfügt über 320 MIPS64-Kerne (OCTEON) und 24×86-Kerne (Intel Westmere). Eingehende Daten werden von den Ethernet-Hubs in Abhängigkeit von bestimmten Richtlinien an die Paketprozessor-Blades weitergeleitet. Die Pakete werden dann an die zwei Octeon-Prozessoren auf dem Blade verteilt, anschließend erfolgt die Verteilung an die Kerne des jeweiligen Prozessors. Ein Großteil der Verarbeitung mit hohem Durchsatz wird von den Paketprozessoren durchgeführt. Pakete, die umfangreichere Verarbeitung erfordern, werden an die x86-Blades weitergeleitet. Dies sorgt für hohe Effizienz, da der Verarbeitungsaufwand der meisten Pakete minimal ist.

ATCA-Virtualisierung

In einer virtualisierten Umgebung ist die Konsolidierung mehrerer physischer Server mithilfe eines einzigen Multicore-Prozessors möglich. Die virtuellen Server laufen mit demselben Prozessor, sind jedoch dadurch voneinander getrennt, dass sie unterschiedliche Kerne nutzen. Die Hardware stellt mit Unterstützung von Hypervisor-Software sicher, dass das Betriebssystem auf sichere Weise auf eigenen Speicher und eigene E/A-Geräte zugreifen kann, ohne dabei Konflikte mit benachbarten Servern hervorzurufen. Unabhängig vom Formfaktor ist Virtualisierung eine hervorragende Möglichkeit, die Vorteile von Multicore-Prozessoren optimal zu nutzen. ATCA setzt dieses Konzept auf ideale Weise um, da der Standard die Konsolidierung mehrerer Blades mit jeweils mehreren Multicore-Prozessoren innerhalb eines einzigen Gehäuses ermöglicht. So können ganze Server-Racks in nur einem Chassis zusammengefasst werden. Virtualisierung mit ATCA sorgt darüber hinaus für Redundanz, da ein hoch verfügbares virtualisiertes Betriebssystem im Falle eines Hardwarefehlers die Migration von Anwendungen von einem physischen Server zu einem anderen erlaubt.

Multicore-Entwicklungstools

Paketprozessoren sind speziell auf Parallelverarbeitung ausgelegt. Entsprechend sind Softwaretools für die Anwendungsentwicklung in Multicore-Umgebungen verfügbar. Octeon-Prozessoren von Cavium und vergleichbare Produkte basieren auf Standard-Architekturen (bei Cavium z. B. MIPS64), die für Standard-Betriebssysteme wie Linux ausgelegt sind. Ihre beste Performance erreichen Paketprozessoren jedoch dann, wenn sie in Kombination mit vereinfachten proprietären Betriebssystemen eingesetzt werden, beispielsweise Simple Executive von Cavium. Die derzeit verwendeten Paketprozessoren sind in C und C++ programmiert, auch wenn sie mit ihrem proprietären Betriebssystem laufen. Verschiedene Softwareangebote wie etwa 6WINDGate sorgen für die reibungslose Zusammenarbeit zwischen x86- und Paketprozessoren und vereinfachen die Softwareentwicklung erheblich.

Fazit

Multicore-Prozessoren passen dank ihrer hohen Rechendichte, Zuverlässigkeit und Redundanzoptionen ideal zur ATCA-Infrastruktur. Die redundante High-Speed-ATCA-Backplane unterstützt sowohl Kommunikationsanwendungen wie auch rechenintensive Aufgaben. Ethernet-Switches bieten Lastausgleich und richtlinienbasiertes Routing zu den Blades im Gehäuse. Dies verhindert Flaschenhalseffekte und sorgt für die optimale Ausnutzung der Prozessorleistung. Virtualisierung ermöglicht die Ausführung mehrerer Anwendungen über denselben Prozessor eines ATCA-Blade und damit die bestmögliche Nutzung der verfügbaren Kerne. Dank ausgereifter Softwaretools bereitet die Anwendungsentwicklung keine nennenswerten Probleme.

GE Intelligent Platforms GmbH
www.ge-ip.com

Das könnte Sie auch Interessieren