placeholder

Embedded Grafikprozessoren als Rechenmaschinen GPGPU-Programmierung mit OpenCL

Embedded Design II 2012

Embedded Grafikprozessoren als Rechenmaschinen GPGPU-Programmierung mit OpenCL

Heutige Embedded Grafikprozessoren sind massiv-parallele Rechenmaschinen, die frei programmierbar sind. In dieser Eigenschaft werden sie General Purpose Graphics Processing Units (GPGPUs) genannt. Programmieren kann man sie mit dem offenen und standardbasierten OpenCL Framework, mit dem man Rechenaufgaben auf CPUs, GPUs und DSPs verteilen kann, um so die Gesamtleistung eines Systems zu optimieren.
Neben dem guten „GFLOPS-pro-Dollar“-Verhältnis bieten GPGPUs eine hohe Performance pro Watt. Hochleistungsplattformen wie die AMD Radeon HD 6970 Grafikkarte liefern beispielsweise 10 GFLOPS pro Watt. Sie eignen sich jedoch aufgrund der Thermal Design Power (TDP) von 250 Watt vorrangig für serverbasierte Applikationen, bei denen man mit dieser Leistungsaufnahme problemlos umgehen kann. Bei vielen Embedded Applikationen muss der Grenzwert für die TDP deutlich geringer liegen. Gründe hierfür sind oft umgebungsbedingte Beschränkungen hinsichtlich Größe, Gewicht und Leistungsaufnahme (Size, Weight and Power = SWaP). Portable Ultraschallgeräte beispielsweise, sollen möglichst klein sein, benötigen aber eine hohe Rechenleistung für die Bildverarbeitung in Echtzeit. Auch Telekommunikations-Infrastrukturen, bei denen die Computing-Anforderung hoch, die Grenzen für die Leistungsaufnahme aber limitiert sind, können von GPGPU-Technologie profitieren. Viele Wehrtechnik- und Luftfahrt-Applikationen, wie beispielsweise Sonar, Radar und Videoüberwachung benötigen hohe Rechenleistung auf Embedded-Formfaktoren. Für diesen Bedarf liefert die AMD Radeon E6760 Embedded GPU mit 480 Stream-Prozessoren 16,5 GFLOPS pro Watt bei einer TDP von nur 35 Watt und damit eine Leistungsaufnahme, die für alle gängigen Embedded Systeme geeignet ist, die auf slotbasierten Rackmoutsystemen basieren wie beispielsweise PICMG 1.x, CompactPCI, VME, VPX, MicroTCA sowie AdvancedTCA.

Effiziente Algorithmen

Um von dem vollen Leistungspotential eingebetteter GPGPU-Anwendungen zu profitieren, ist zudem die Entwicklung grundlegender Algorithmen für spezifische GPU-Architekturen erforderlich. Zu den wichtigsten Algorithmen zählen lineare Gleichungen, Matrizenmultiplikationen, schnelle Fourier-Transformationen, Zufallszahlenerzeugung, elementare Funktionen wie z.B. Subtraktion, Summe, Teilung, Sortieren, etc. sowie domänenspezifische Algorithmen in der Bildverarbeitung . Eine weitere Aufgabe ist die Entwicklung paralleler Algorithmen. Einige Workloads sind beispielsweise nativ parallel. Entsprechende parallele Algorithmen liefern deshalb gegenüber Implementierungen auf Multi-Core CPUs eine viel höhere Leistung. Andere Algorithmen benötigen etwas mehr Aufwand, um sie auf eine massiv-parallele Umgebung zu portieren, aber die Ergebnisse können den Aufwand rechtfertigen. Untersuchungen haben ergeben, dass die Ausführung einer Single Precision General Matrix Multiply Routine (SGEMM) auf einer ATI Radeon HD5870 GPU bis zu 73 Prozent der theoretischen Single-Precision Floating-Point Leistung der GPU erreicht kann. Mit ihrer hohen Rechendichte und parallelen Natur ist SGEMM deshalb gut für die Implementierung auf GPGPU-Plattformen geeignet – insbesondere, wenn es um die Verarbeitung großer Matrizen geht.

Offener Standard

Das Potenzial zur parallelen Programmierung ist schon länger bekannt. Den Pionieren der GPGPU-Technologie standen jedoch noch keine Programmiersprachen zur Verfügung, um die massiv-parallele Rechenleistung der GPUs einfach abzurufen. Stattdessen griffen sie auf Grafikoperationen unter OpenGL zurück, welche vergleichbare mathematische Funktionen nutzten, wie sie zur Berechnungen einer bestimmten Aufgabe benötigt wurden. Anschließend kopierten sie die Ergebnisse dann aus dem Frame Buffer. Proprietäre GPGPU-Programmiersprachen wie CUDA und Brook+ vereinfachten zwar diese Nutzung, was jedoch nicht gelöst ist, ist die Portabilität der Algorithmen. Diese Situation führte zur Entwicklung von OpenCL (Open Computing Language) mit der Entwickler ihre Applikationen auf unterschiedliche Hardware (CPUs, GPUs und DSPs) verteilen können. OpenCL wurde 2008 von einem Industrie-Konsortium geschaffen. Heute sind viele Chip-Hersteller, Software-Firmen und Forschungseinrichtungen Mitglieder des Konsortiums, das sich um die Weiterentwicklung dieses offenen Standards für die parallele Programmierung in heterrogenen Umgebungen kümmert.

Weitere Information

Thematik: Allgemein, Embedded Design II 2012

AMD Advanced Micro Devices GmbH

Zur Firmenwebsite

MEHR ZUM THEMA

Bild: RWTH Aachen University Werkzeugmaschinenlabor WZL der

Forschungsprojekt von WZL und Riiico

AutoSim automatisiert die Erstellung digitaler Simulationsmodelle

Bild: NetApp Deutschland GmbH

Verantwortung für technische Strategie

NetApp ernennt CTO & VP Sales Engineering für EMEA und Lateinamerika

Engineering-Spezialist JuliaHub erhält 65 Millionen US-Dollar

Bild: JuliaHub, Inc.

Bild: ISC2

Kommentar zum World Quantum Day

Postquantenkryptografie: frühzeitig vorbereiten, spätere Störungen vermeiden

Zum World Quantum Day am 14. April äußert sich Jon France, CISO von ISC2 (International Information System Security Certification Consortium), einer Nonprofit-Organisation für Cybersecurity-Experten zum aktuellen Status der…

Weiterlesen: Postquantenkryptografie: frühzeitig vorbereiten, spätere Störungen vermeiden
Bild: Protolabs Germany GmbH

Transformation der Fertigung

Protolabs-Report identifiziert KI als Wegbereiter für Industrie 5.0

Protolabs, ein Anbieter von digitalen Fertigungsdienstleistungen, analysiert in einem aktuellen Bericht Faktoren, die die technologische Weiterentwicklung der Fertigungsindustrie über den gesamten Produktlebenszyklus hinweg beschleunigen.

Weiterlesen: Protolabs-Report identifiziert KI als Wegbereiter für Industrie 5.0
Bild: Sereact GmbH

Künstliche Intelligenz für Roboter

Sereact sichert sich frisches Kapital

Sereact, ein Spezialist für physische KI, hat eine Serie-B-Finanzierungsrunde in Höhe von 110Mio.US$ unter der Führung von Headline abgeschlossen, an der sich Bullhound Capital, Daphni und Felix Capital…

Weiterlesen: Sereact sichert sich frisches Kapital
Bild: ©Franz Pfluegl/stock.adobe.com

Verhalten nach Ransomware-Angriffen

Lösegeld zahlen ist keine Lösung

Laut dem Spezialversicherer Hiscox, der sich auf die polizeiliche Kriminalstatistik beruft, richten sich inzwischen rund 80% aller bekannten Ransomware-Angriffe gegen kleine und mittlere Unternehmen.

Weiterlesen: Lösegeld zahlen ist keine Lösung
Bild: IFS Deutschland GmbH

Managementwechsel

Ryan Courson wird Finanzchef bei IFS

IFS hat Ryan Courson (Bild) zum Chief Financial Officer ernannt.

Weiterlesen: Ryan Courson wird Finanzchef bei IFS

Neu im Werk Rahden

Harting eröffnet Kompetenzzentrum für 3D-Druck

Die Harting Technologiegruppe baut ihre Kompetenzen im Bereich 3D-Druck aus und eröffnet das ‚Center of…

Weiterlesen: Harting eröffnet Kompetenzzentrum für 3D-Druck
Neue Zahlen vom VDMA

Auftragsdämpfer für den Maschinen- und Anlagenbau

Im deutschen Maschinen- und Anlagenbau sanken die Bestellungen im Februar insgesamt um 12% zum Vorjahr.

Weiterlesen: Auftragsdämpfer für den Maschinen- und Anlagenbau

SAP Procurement

All for One Group übernimmt Apsolut

Das IT-Consulting-Unternehmen All for One aus Filderstadt hat mit Wirkung zum 5. März alle Anteile an dem SAP Procurement-Spezialisten und SAP Gold…

Weiterlesen: All for One Group übernimmt Apsolut
Neuer Vorstandsbereich bei SAP

Thomas Saueressig wird Chief Customer Officer

SAP hat die Gründung des neuen Vorstandsbereichs Customer Value Group bekannt gegeben, in dem die Bereiche Customer Success und Customer Services &…

Weiterlesen: Thomas Saueressig wird Chief Customer Officer

Ausbau in Richtung Supply Chain Management

Swan erweitert die Geschäftsführung

Swan hat Matthias Martens (l.) als weiteren Geschäftsführer berufen.

Weiterlesen: Swan erweitert die Geschäftsführung
VDMA startet ‚Wochen der Technik‘

In einer aktuellen Umfrage unter VDMA-Mitgliedsfirmen berichten 35 Prozent der Unternehmen von starken Engpässen auf dem Ausbildungsmarkt und 50 Prozent von leichten…

Weiterlesen: VDMA startet ‚Wochen der Technik‘
Projektmanagement-Tool von MPDV

Die neue Shopfloor-App Detailed Project Management von MPDV bildet das Projektmanagement im Produktionsunternehmen digital ab.

Weiterlesen: Projektmanagement-Tool von MPDV
Emulationstool zur Optimierung der KI-Infrastruktur

Ein neues Tool von Keysight Technologies heißt Keysight AI (KAI) Data Center Builder.

Weiterlesen: Emulationstool zur Optimierung der KI-Infrastruktur

Drahtlose Konnektivität in der Fabrik

Das 5G-Campusnetz bei Jaguar Land Rover

Konnektivität wird in der Automobilproduktion immer wichtiger. JLR setzt hier auf 5G-Funktechnik anstelle von Kabelverbindungen. Gemeinsam mit Ericsson hat der Hersteller von…

Weiterlesen: Das 5G-Campusnetz bei Jaguar Land Rover
Technologischer Fortschritt und Eigenschaften

Eine kurze Geschichte der Industrie-PCs

Industrielle PCs sind auf Zuverlässigkeit getrimmt und kommen zum Teil in rauen Umgebungen zum Einsatz. Von den ersten Industrie-PCs, die in den…

Weiterlesen: Eine kurze Geschichte der Industrie-PCs
Ifo Geschäftsklimaindex steigt um 0,2 Punkte

Die Stimmung der Unternehmen in Deutschland hat sich im April leicht verbessert.

Weiterlesen: Ifo Geschäftsklimaindex steigt um 0,2 Punkte
Wie schwer ist der Einstieg ins Ingenieurwesen?

Eine Studie der Karriereplattform Jobleads zeigt, dass es für Berufstätige am schwersten ist, in das Finanzwesen einzusteigen.

Weiterlesen: Wie schwer ist der Einstieg ins Ingenieurwesen?
Wie KI die Fertigungsindustrie transformiert

TeamViewer hat auf der Hannover Messe den Report ‚The AI Opportunity in Manufacturing‘ vorgestellt, der das transformative Potenzial von KI in der…

Weiterlesen: Wie KI die Fertigungsindustrie transformiert
IFM baut neues Werk in China

Mit der symbolischen Grundsteinlegung hat IFM am 15. April die Bauphase des Greenfield-Projektes im chinesischen Suzhou eingeläutet.

Weiterlesen: IFM baut neues Werk in China
Prostep entwickelt KI-Chatbot für den Digitalen Produktpass

. Prostep hat im Rahmen des vom Bundesministerium für Wirtschaft und Klimaschutz (BMWK) geförderten Verbundprojekts Decide4Eco einen KI-basierten Chatbot entwickelt, der Informationen…

Weiterlesen: Prostep entwickelt KI-Chatbot für den Digitalen Produktpass
MHP schließt Partnerschaft mit Softwarehersteller Cybus

Um Unternehmen bei der Digitalisierung zu unterstützen, haben die Management- und IT-Beratung MHP sowie der Softwarehersteller Cybus eine Partnerschaft vereinbart.

Weiterlesen: MHP schließt Partnerschaft mit Softwarehersteller Cybus