placeholder

Fork-Join-Services im Low-Power-Mode

Um Fork-Services im POSIX-Stil zu unterstützen, ist ein gängiger Weg, rund um die Thread-Erzeugungs-API eine Wrapper-Funktion zur Verfügung zu stellen, die zusätzlich die Einrichtung einer Mailbox oder eines Ereignisses im Zusammenhang mit diesem Child-Thread enthält. Information von einem Ereignis (Mailbox) werden den Thread-Daten – wenn möglich in der Thread-Control-Box – hinzugefügt. Im Falle eines Join-Calls überprüft das RTOS den Mailbox-Status um festzustellen, ob das Child die Ausführung abgeschlossen hat. Diese simple Anordnung führt zu einem TLP-Synchronisierungs-Overhead, da sie von den Komponenten des RTOS und nicht vom Software-Kontext abhängt. Das in Abbildung 1 vorgeschlagene Schema zeigt die Knoten, die einen Thread – entweder Parent oder Child – darstellen, während die Verzweigungen den Fork-Join-Betrieb abbilden. Jeder Knoten wird durch eine Prioritätsstufe gekennzeichnet, mit Ausnahme des letzten Knoten E. Children haben in Beziehung zum Parent einen höheren Level. Jedes Child reagiert auf einen Join-Call vom Parent, um den Abschluss anzuzeigen. Die vorgeschlagenen RTOS-Fork-Join-Services umfasst bei jedem Systemaufruf die folgenden Schritte: Wenn ein Parent den Thread-Status überprüft und ein anderer Zustand als ‚Ende‘ angezeigt wird, existieren mehr parallele Ressourcen als die verbliebene Anzahl von Children. Andernfalls könnte der Parent nicht noch einmal ablaufen und Join aufrufen. So kann es einen Scheduler-Durchlauf dauern, bis andere Tasks ablaufen können. Für den Fall, dass Parent und Children die einzigen Lasten im System sind, kann der Kern, auf dem der Join-Call durchgeführt wurde, gefahrlos in einen Low-Power-Mode wechseln. Dies geschieht in dem Wissen, dass dieser Kern jetzt nichts mehr zu tun hat. Zu beachten ist, dass, obwohl Dynamic Voltage and Frequency Scaling (FVFS) schwierig zu erreichen ist, nahezu alle Anbieter Low-Power-CPU-Modi unterstützen. Das erhöht die Portabilität der vorgeschlagenen Lösung. Als Beispiel dient eine parallele Multithread-Anwendung, die aus acht Child-Threads auf einem Vier-Kern-System besteht. Abbildung 2 zeigt ein Ablaufdiagramm von RTOS-Fork-Join-Services, die diesen Anwendungsfall unterstützen. Jede Spalte stellt einen einzelnen Kern dar. Auf Kern null (C0) verteilt der Parent-Thread (Thread_Fork) nacheinander acht Child-Threads, ohne dass er die Kontrolle über den Prozessor verliert. Während der Parent-Thread die Child-Threads verteilt, sind im System drei Kerne frei. Auf diesen können die ersten drei Child-Threads ablaufen, ohne auf den Parent warten zu müssen. Das vierte Child muss ausharren, bis der Parent alle Threads erstellt hat. Dadurch wird gewährleistet, dass der Parent die Arbeit beim Erstellen der Child-Threads bei einem Kern verrichtet. Wenn ein Parent – auf irgendeinem freien Kern – wieder die Kontrolle hat, werden einige der Children bereits ihre Aufgabe abgeschlossen haben und Thread_Join erfordert nur die Statusprüfung einer ‚Flag‘ im Thread-Control-Block. Dies ist für Child null bis sechs der Fall, bei denen aufgrund der Prioritätenbeziehung zwischen Parent- und Child-Threads keine Synchronisation erforderlich ist. Da der letzte Thread, der zu Child hinzukommen soll, noch nicht fertig ist und Parent der Thread mit der niedrigsten Priorität ist, bedeutet das, dass das System nun leicht belastet ist. Deshalb wird der Kern auf dem der Parent läuft in einen Low-Power-Mode versetzt. Sobald Thread sieben beendet ist, weckt er diesen Kern mit Hilfe eines Hardware-unterstützten Ereignisses auf, was Synchronisationszwecken dient.

Zeitvergeudung für interne Betriebslogistik

Dieser Anwendungsfall lässt sich vergleichen mit seinem Gegenpart, der für die Thread-Synchronisation RTOS-Konstrukte wie Message-Passing oder Ereignisse nutzt. Als erstes ist zu beachten, dass – weil üblicherweise ein Child die Priorität seines Parent erbt – ein Parent in der Lage ist, alle Children zu erstellen. Child vier muss dann jedoch warten, bis der Parent Thread_Join gegen den ersten Child-Thread aufruft. Wenn der Parent diesen Aufruf unterbricht, weil die Abschluss-Message von Child vier noch nicht eingetroffen ist, dann kann Child vier auf dem vom Parent freigegebenen Kern ablaufen. Dies hängt natürlich von der Zeitdauer ab, die Child eins bis zum Abschluss benötigt. Das Resultat ist, dass die für die Berechnung erforderliche Zeit auf interne Betriebssystemlogik verschwendet wird und somit den Synchronisations-Overhead erhöht.

Overhead-Einsparungen von rund drei Prozent

Um die beschriebene Lösung zu verifizieren, wurde eine CPU-abhängige Skalarprodukt-Applikation entwickelt und auf einem ARM-Cortex-A9-MPCore mit vier identischen, mit 400MHz getakteten Kernen getestet. Als RTOS kam das Nucleus-RTOS von Mentor Graphics zum Einsatz, das mit Mentors Sourcery GNU-Tools für ARM EABI kompiliert wurde. Die Ergebnisse für die vorgeschlagenen und die Message-Passing (MP) basierten Fork-Join-Schemata sind in Abbildung 3 für Matrixgrößen von 2048, 4096 und 8192 zu sehen. Da der Overhead eine Funktion der Anzahl der Threads ist, wird jede Matrixgröße im Vergleich zu 2, 4, 8 und 16 Threads ausgewertet. Zu erkennen ist, dass in allen Fällen die beschriebene Technik zu einer niedrigeren Ausführungszeit mit durchschnittlichen Overhead-Einsparungen von rund drei Prozent führt. Zudem verspricht sie eine reduzierte Stromaufnahme. Da in einer hochparallelen Anwendung wie einem Skalarprodukt der Overhead ein Bruchteil der absoluten Ausführungszeit ist, sind die Einsparungen hier signifikant.

Weitere Information

4. Oktober 2012

Allgemein, Embedded Design VI 2012

Mentor Graphics (Deutschland) GmbH

Zur Firmenwebsite

MEHR ZUM THEMA

Bild: Secunet Security Networks AG

Cyberresilienz in der Cloud

Secunet und Cloudflare gehen Partnerschaft ein

Bild: ifo Institut

Befragung des Ifo Instituts

Mehr Industrieunternehmen melden Materialengpässe

Bild: ©JD Studio/stock.adobe.com

Reifegrad legt zu

Box liefert aktuelle Zahlen zum KI-Einsatz in Unternehmen

Das Unternehmen Box hat 1.640 IT-Entscheider weltweit zum aktuellen Stand des KI-Einsatzes in ihren Unternehmen befragt.

Weiterlesen: Box liefert aktuelle Zahlen zum KI-Einsatz in Unternehmen
Bild: ©fizkes_AdobeStock_431649902

Zur Vorbereitung auf den CRA

Neues Weiterbildungsangebot zum Cyber Resilience Act

Die Eclipse Foundation hat gemeinsam mit der Open Regulatory Compliance Working Group das kostenfreie Bildungsangebot ORC Learning Hub gestartet.

Weiterlesen: Neues Weiterbildungsangebot zum Cyber Resilience Act
Bild: Keba Group AG

Keba Digital

Keba gründet Geschäftseinheit für Software und KI

Die Keba Gruppe kündigt mit Keba Digital eine Einheit für digitale Lösungen an.

Weiterlesen: Keba gründet Geschäftseinheit für Software und KI
Bild: ©Jürgen Ernst / Fraunhofer IIS

Für mehr Souveränität

Fraunhofer-Institute entwickeln RISC-V-Sicherheitschip

Die Fraunhofer-Institute IIS, AISEC und EMFT stellen mit dem RISC-V-Secure-Element einen Sicherheitschip vor, der nach Angaben der Beteiligten vollständig in Deutschland designt und gefertigt wurde.

Weiterlesen: Fraunhofer-Institute entwickeln RISC-V-Sicherheitschip
Bild: Fraunhofer-Institut IWU

Hybrid-autonomes Montagesystem HAutoMont

PKW-Unterbodenverkleidungen effizienter montieren

Ein Projektteam aus Fraunhofer IWU und Volkswagen Sachsen erprobt am Fraunhofer IWU ein hybrid-autonomes Montagesystem (HAutoMont), das eine wirtschaftliche und teilautonome Montage von PKW-Unterbodenverkleidungen ermöglichen soll.

Weiterlesen: PKW-Unterbodenverkleidungen effizienter montieren

Verantwortlich für DACH-Strategie

Eva-Maria Glenz wird Area Vice President DACH

Als Area Vice President der neu geschaffenen Commvault-DACH-Region übernimmt Eva-Maria Glenz (Bild) die Verantwortung für…

Weiterlesen: Eva-Maria Glenz wird Area Vice President DACH
Echtzeit-Übersetzung

DeepL übernimmt Mixhalo

DeepL, ein Spezialist für KI-Sprachtechnologie, hat die Übernahme von Mixhalo bekannt gegeben, einem in San…

Weiterlesen: DeepL übernimmt Mixhalo

Sonderforschungsbereich am RWTH untersucht Schweißprozesse

Dem Geheimnis des Schweißens auf der Spur

Forschende der RWTH Aachen arbeiten im Sonderforschungsbereich ‚1120 Bauteilpräzision‘ daran, Abläufe beim Schweißen besser zu verstehen und mit Simulationen genauer abzubilden.

Weiterlesen: Dem Geheimnis des Schweißens auf der Spur
Um Open-Source-Fachleute in internationale Normungsgremien zu bringen

DIN und Sovereign Tech Agency arbeiten zusammen

Mit einer neuen Kooperationsvereinbarung wollen das Deutsche Institut für Normung e.V.

Weiterlesen: DIN und Sovereign Tech Agency arbeiten zusammen

Verhalten nach Ransomware-Angriffen

Lösegeld zahlen ist keine Lösung

Laut dem Spezialversicherer Hiscox, der sich auf die polizeiliche Kriminalstatistik beruft, richten sich inzwischen rund 80% aller bekannten Ransomware-Angriffe gegen kleine und…

Weiterlesen: Lösegeld zahlen ist keine Lösung
Managementwechsel

Ryan Courson wird Finanzchef bei IFS

IFS hat Ryan Courson (Bild) zum Chief Financial Officer ernannt.

Weiterlesen: Ryan Courson wird Finanzchef bei IFS
Frisches Kapital und neue Produktversion

Engineering-Spezialist JuliaHub erhält 65 Millionen US-Dollar

JuliaHub gibt den Start von Version 3.0 seiner agentenbasierten KI-Plattform für Hardware-Engineering, Dyad, sowie den Abschluss einer Series-B-Finanzierungsrunde über 65 Millionen US-Dollar…

Weiterlesen: Engineering-Spezialist JuliaHub erhält 65 Millionen US-Dollar
Verantwortung für technische Strategie

NetApp ernennt CTO & VP Sales Engineering für EMEA und Lateinamerika

NetApp hat Jürgen Hofkens mit Wirkung zum 1. Mai zum Chief Technology Officer & Vice President of Sales Engineering für EMEA und…

Weiterlesen: NetApp ernennt CTO & VP Sales Engineering für EMEA und Lateinamerika

OT-Securitysystem Stellar in Version 3.2

Die Stellar-Endpunktsoftware von TXOne Networks steht jetzt als Version 3.2 zur Verfügung.

Weiterlesen: OT-Securitysystem Stellar in Version 3.2
SAP Procurement

All for One Group übernimmt Apsolut

Das IT-Consulting-Unternehmen All for One aus Filderstadt hat mit Wirkung zum 5. März alle Anteile an dem SAP Procurement-Spezialisten und SAP Gold…

Weiterlesen: All for One Group übernimmt Apsolut
Neuer Vorstandsbereich bei SAP

Thomas Saueressig wird Chief Customer Officer

SAP hat die Gründung des neuen Vorstandsbereichs Customer Value Group bekannt gegeben, in dem die Bereiche Customer Success und Customer Services &…

Weiterlesen: Thomas Saueressig wird Chief Customer Officer
Neu im Werk Rahden

Harting eröffnet Kompetenzzentrum für 3D-Druck

Die Harting Technologiegruppe baut ihre Kompetenzen im Bereich 3D-Druck aus und eröffnet das ‚Center of Competence Additive Manufacturing‘ im Werk Rahden.

Weiterlesen: Harting eröffnet Kompetenzzentrum für 3D-Druck
Neue Zahlen vom VDMA

Auftragsdämpfer für den Maschinen- und Anlagenbau

Im deutschen Maschinen- und Anlagenbau sanken die Bestellungen im Februar insgesamt um 12% zum Vorjahr.

Weiterlesen: Auftragsdämpfer für den Maschinen- und Anlagenbau
Kommentar zum World Quantum Day

Postquantenkryptografie: frühzeitig vorbereiten, spätere Störungen vermeiden

Zum World Quantum Day am 14. April äußert sich Jon France, CISO von ISC2 (International Information System Security Certification Consortium), einer Nonprofit-Organisation…

Weiterlesen: Postquantenkryptografie: frühzeitig vorbereiten, spätere Störungen vermeiden
Transformation der Fertigung

Protolabs-Report identifiziert KI als Wegbereiter für Industrie 5.0

Protolabs, ein Anbieter von digitalen Fertigungsdienstleistungen, analysiert in einem aktuellen Bericht Faktoren, die die technologische Weiterentwicklung der Fertigungsindustrie über den gesamten Produktlebenszyklus…

Weiterlesen: Protolabs-Report identifiziert KI als Wegbereiter für Industrie 5.0
Künstliche Intelligenz für Roboter

Sereact sichert sich frisches Kapital

Sereact, ein Spezialist für physische KI, hat eine Serie-B-Finanzierungsrunde in Höhe von 110Mio.US$ unter der Führung von Headline abgeschlossen, an der sich…

Weiterlesen: Sereact sichert sich frisches Kapital