placeholder

Energieeffizienz dank Multicore

Embedded Design VI 2012

Multithreading im Multiprocessing-Echtzeit-Betriebssystem

Energieeffizienz dank Multicore

Embedded-Software-Entwickler stehen heute Komplexitäten und Anforderungen gegenüber, die vor zehn Jahren noch unvorstellbar waren. Eine der häufigsten Herausforderungen stellt das Thema Energieeffizienz dar: Teams sollen Designs entwickeln, die Vorteile von Hardware- und Software-Power-Management-Funktionen nutzen und gleichzeitig hinsichtlich Funktionalität und Performance optimiert sind.

Energieeffizienz und hohe Leistung müssen sich nicht ausschließen. (Bild: © monsterdruck.de - Fotolia.com) — Energieeffizienz und hohe Leistung müssen sich nicht ausschließen. (Bild: © monsterdruck.de – Fotolia.com)

Trotz des Zielkonflikts zwischen Energieeffizienz und höherer Performance entstehen innerhalb von Embedded-Multicore-Systemdesigns Situationen, in denen sich Leistungsaufnahme und Performance ergänzen: Ein Symmetrisches Multiprocessing-Echtzeit-Betriebssystem (SMP-RTOS) lässt sich mit Multicore-Hardware und Power-Management-Funkionen verbinden, um parallele Embedded-Programmierung zu erleichtern. Obwohl die Power-Management-Funktionen eines vollständig ausgestatten RTOS wesentlich zu einem energieeffizienten Design beitragen, existieren Thread-Synchronisierungsmechanismen, die auf von der Hardware gelieferten Primitiven basieren und für Energieeinsparungen bei gleichzeitiger Verbesserung der System-Performance sorgen. Muliticore hat sich in der Embedded-Welt inzwischen etabliert: Nahezu alle großen Halbleiteranbieter liefern Multicore-Chips, z.B. ARM (Cortex A9), PowerPC (QorIQ), MIPS (1004K MT) und Intel (Atom). Höhere Performance ist aber nicht der einzige Faktor hinter diesem Trend. Embedded Systeme können sich keine Performancesteigerung auf Kosten eines höheren Leistungsbudgets oder Beeinträchtigung vorhandener Software leisten. Embedded-Halbleiteranbieter fokussieren sich deshalb auf eine kleine Anzahl von Kernen, in der Regel nicht mehr als acht.

Flexibel mit Multicore

Eine Embedded-Runtime-Softwarelösung mit Betriebssystem, Middleware und Endanwendungen, die auf Multicore-Plattformen abzielt, muss Performance, Leistungsbedarf und bestehende Softwaredesigns berücksichtigen. Obwohl Parallel-Computing ein ziemlich fortschrittliches Feld mit vielen verfügbaren Programmiersprachen, Architekturen und Computertechnologien ist, führt die parallele Embedded-Entwicklung aufgrund der Vielzahl von Hardware und involvierten Tools zu neuen Anforderungen, die hohe Flexibilität erfordern. Da es keinen allgemein akzeptierten Multicore-Programmierstandard gibt, verlassen sich die meisten Entwickler von Embedded-Anwendungen auf Thread-Level Parallelism (TLP), den das RTOS liefert. In der Theorie verspricht dieser Ansatz keine Veränderungen des bestehenden Codes, wenn die RTOS-Unterstützung für die Multicore-Architektur robust ist. Doch TLP ist immer mit Overhead verbunden. Dies liegt an der Erstellung und Terminierung von Worker-Threads sowie an der Synchronisation zwischen einzelnen Kontexten. Typische Embedded-Systeme besitzen jedoch eine begrenzte Anzahl von Threads. Aktiviert wird ein Software-Kontext üblicherweise als Ergebnis eines externen Ereignisses, z.B. eines Interrupts. Dieser Thread muss dann die Ausführung in der vorgeschriebenen Zeit abschließen. Basierend auf den Eigenschaften von Embedded-Runtime-Applikationen verringert die Verwendung wichtiger Preemption- und Prioritäts-Thread-Attribute in einem Echtzeit-Betriebssystem der TLP-Overhead. Die Grundidee ist es, Parent- und Child-Threads auf verschiedenen Ebenen zu priorisieren, damit keine Synchronisierungszeit erforderlich ist. In Situationen, in denen eine Synchronisation unvermeidlich ist, verwendet das vorgeschlagene Schema energiesparende Primitiven, die von der Hardware geliefert werden. Ein weiterer Ansatz zur Entwicklung von Lastausgleichsstrategien und neuen Echtzeit-Scheduling-Algorithmen besteht darin, maximale Auslastung von mehreren Ressourcen zu erlangen. Aber diese Schemata erfordern in der Anwendungslogik oder im Betriebssystem-Code oft signifikante Änderungen. Sie haben für ein praktikables System erhebliche Nachteile, da ein Großteil des vorhandenen, zertifizierten und robusten Codes entweder gefährdet oder unbrauchbar ist. Statt der Suche nach einer optimalen Scheduling-Technik oder raffinierten Compiler-Technologie, empfiehlt sich ein portables Schema, das den Anwendungscode nicht beeinflusst und nur Veränderungen der Wrapper-Funktion der RTOS-Schnittstelle enthält.

Systemmodell: Round Robin oder Priorisierung

Das als Beispiel gewählte Embedded-System besteht aus einer Multicore-Plattform mit M identischen bzw. homogenen Kernen. Der SMP-RTOS-Thread-Scheduler folgt dem traditionellen Ansatz eines primitiven Threading-Modells mit festen Prioritäten. Diese Art des Schedulings ist in den heute kommerziell verfügbaren RTOS am weitesten verbreitet. Ein solcher Ansatz sorgt dafür, dass der wichtigste Thread immer als erster abläuft. Jeder unterbrechbare Thread mit niedrigerer Priorität kann nur von einem Thread mit höherer Priorität angehalten werden. Daher ist für wichtige Threads eine indirekte Garantie für den Echtzeitbetrieb erhältlich. Threads mit gleicher Priorität werden nach dem Round-Robin-Verfahren ausgeführt. Eine einfache Multicore-Erweiterung dieses Modells nimmt den Thread mit der höchsten Priorität ’n‘ (0 < M-1) und versendet ihn an einen der ’n‘ verfügbaren freien Kerne. Will man so viel Legacy-Code wie möglich nutzen, geht der einfachste Weg zur Multicore-Entwicklung über TLP unter einem Parent-Child-Programmiermodell. Bei diesem Beispiel bleibt der Code unabhängig von parallelen Programmierkonstrukten. Das Parent-Child-Modell hat keinen Einfluss auf die Deadline-Anforderungen solange es TLP unter den Grenzwerten halten kann. Beispielsweise kann ein vorhandener Anwendungs-Thread (Parent), der Video-Frames dekodiert, die Ausführung mit Hilfe von TLP beschleunigen, wenn er Frames unter den Child-Threads aufteilt. Diese Child-Threads laufen parallel auf mehreren verfügbaren Kernen ab und erhöhen so unter Umständen die Performance des Systems. Dort gibt es nur sehr geringe Anforderungen für Codeänderungen. Ein ‚Parent‘ muss verteilen und dann auf alle ‚Children‘ warten, um eine Task abzuschließen. Wenn Thread-Erstellung (Fork) und Wartezeit (Join) im Vergleich zur Thread-Workload klein sind, lassen sich die Deadline-Anforderungen des Original-Threads leicht erfüllen. Fork- und Join-Services sind üblicherweise Wrapper, die andere Standard-RTOS-Schnittstellen umgeben.

Weitere Information

4. Oktober 2012

Allgemein, Embedded Design VI 2012

Mentor Graphics (Deutschland) GmbH

Zur Firmenwebsite

MEHR ZUM THEMA

Bild: DeepL SE

Echtzeit-Übersetzung

DeepL übernimmt Mixhalo

Bild: Commvault Systems Gmbh

Verantwortlich für DACH-Strategie

Eva-Maria Glenz wird Area Vice President DACH

Bild: NetApp Deutschland GmbH

Verantwortung für technische Strategie

NetApp ernennt CTO & VP Sales Engineering für EMEA und Lateinamerika

NetApp hat Jürgen Hofkens mit Wirkung zum 1. Mai zum Chief Technology Officer & Vice President of Sales Engineering für EMEA und Lateinamerika ernannt.

Weiterlesen: NetApp ernennt CTO & VP Sales Engineering für EMEA und Lateinamerika
Bild: RWTH Aachen University Werkzeugmaschinenlabor WZL der

Forschungsprojekt von WZL und Riiico

AutoSim automatisiert die Erstellung digitaler Simulationsmodelle

Das Forschungsprojekt AutoSim vereinfacht die Erstellung von Simulationsmodellen für die Produktion. Es kombiniert intelligente Datenverarbeitung mit interoperablen Informationsmodellen.

Weiterlesen: AutoSim automatisiert die Erstellung digitaler Simulationsmodelle
Bild: ©goodluz/stock.adobe.com

Mit Finanzinvestor im Hintergrund

Xait übernimmt Mehrheit an SAE

Xait hat eine Mehrheitsbeteiligung an der SAE erworben. Das teilte das Unternehmen am 27. Mai in Stockholm mit.

Weiterlesen: Xait übernimmt Mehrheit an SAE
Bild: ©Peter Winandy

Sonderforschungsbereich am RWTH untersucht Schweißprozesse

Dem Geheimnis des Schweißens auf der Spur

Forschende der RWTH Aachen arbeiten im Sonderforschungsbereich ‚1120 Bauteilpräzision‘ daran, Abläufe beim Schweißen besser zu verstehen und mit Simulationen genauer abzubilden.

Weiterlesen: Dem Geheimnis des Schweißens auf der Spur
Bild: ©Peter-Paul Weiler

Um Open-Source-Fachleute in internationale Normungsgremien zu bringen

DIN und Sovereign Tech Agency arbeiten zusammen

Mit einer neuen Kooperationsvereinbarung wollen das Deutsche Institut für Normung e.V.

Weiterlesen: DIN und Sovereign Tech Agency arbeiten zusammen

Managementwechsel

Ryan Courson wird Finanzchef bei IFS

IFS hat Ryan Courson (Bild) zum Chief Financial Officer ernannt.

Weiterlesen: Ryan Courson wird Finanzchef bei IFS
Frisches Kapital und neue Produktversion

Engineering-Spezialist JuliaHub erhält 65 Millionen US-Dollar

JuliaHub gibt den Start von Version 3.0 seiner agentenbasierten KI-Plattform für Hardware-Engineering, Dyad, sowie den…

Weiterlesen: Engineering-Spezialist JuliaHub erhält 65 Millionen US-Dollar

Künstliche Intelligenz für Roboter

Sereact sichert sich frisches Kapital

Sereact, ein Spezialist für physische KI, hat eine Serie-B-Finanzierungsrunde in Höhe von 110Mio.US$ unter der Führung von Headline abgeschlossen, an der sich…

Weiterlesen: Sereact sichert sich frisches Kapital
Verhalten nach Ransomware-Angriffen

Lösegeld zahlen ist keine Lösung

Laut dem Spezialversicherer Hiscox, der sich auf die polizeiliche Kriminalstatistik beruft, richten sich inzwischen rund 80% aller bekannten Ransomware-Angriffe gegen kleine und…

Weiterlesen: Lösegeld zahlen ist keine Lösung

SAP Procurement

All for One Group übernimmt Apsolut

Das IT-Consulting-Unternehmen All for One aus Filderstadt hat mit Wirkung zum 5. März alle Anteile an dem SAP Procurement-Spezialisten und SAP Gold…

Weiterlesen: All for One Group übernimmt Apsolut
Neuer Vorstandsbereich bei SAP

Thomas Saueressig wird Chief Customer Officer

SAP hat die Gründung des neuen Vorstandsbereichs Customer Value Group bekannt gegeben, in dem die Bereiche Customer Success und Customer Services &…

Weiterlesen: Thomas Saueressig wird Chief Customer Officer
Neu im Werk Rahden

Harting eröffnet Kompetenzzentrum für 3D-Druck

Die Harting Technologiegruppe baut ihre Kompetenzen im Bereich 3D-Druck aus und eröffnet das ‚Center of Competence Additive Manufacturing‘ im Werk Rahden.

Weiterlesen: Harting eröffnet Kompetenzzentrum für 3D-Druck
Neue Zahlen vom VDMA

Auftragsdämpfer für den Maschinen- und Anlagenbau

Im deutschen Maschinen- und Anlagenbau sanken die Bestellungen im Februar insgesamt um 12% zum Vorjahr.

Weiterlesen: Auftragsdämpfer für den Maschinen- und Anlagenbau