4 Missverständnisse im IIoT

4 Missverständnisse im IIoT

Die Digitalisierung der Industrie geht, abseits von kleineren Pilotprojekten, oftmals schleppend voran und wird von vielen als Mammutaufgabe wahrgenommen. Industrie 4.0 bedeutet tatsächlich gänzlich neue Anforderungen an die Datenhaltung und -analyse. In diesem Beitrag deckt Christian Lutz, CEO von Crate.io, die vier häufigsten Missverständnisse im IIoT auf, die Anwender und Entwickler von der Umsetzung abhalten.

Viele Unternehmen halten sich zu lange an den Missverständnissen auf und vergessen einfach anzufangen. (Bild: Crate.io GmbH)

Viele Unternehmen halten
sich zu lange an den Missverständnissen auf und vergessen einfach anzufangen. (Bild: Crate.io GmbH)

Analysten wie Gartner Research weisen darauf hin, dass IoT vollkommen neue Herausforderungen in Bezug auf Datenvolumen, Daten- und Abfragekomplexität sowie die Integration stellt. Tatsächlich ist es ein gewaltiger Unterschied, ob eine Maschine im Stand-Alone-Betrieb oder innerhalb einer vernetzten IIoT-Lösung mit Remote-Überwachung arbeitet.

Es gibt kein neues Datenproblem

Ein häufiger Fehler liegt darin zu versuchen, die IIoT-Infrastruktur auf Basis der bestehenden, traditionellen Datenbanken (z.B. Microsoft SQL Server, Oracle, et al.) zu implementieren. Diese sind meist technisch nicht in der Lage, die gestiegenen Anforderungen aufgrund der zu verarbeitenden Datenmengen zu erfüllen, aber auch zu teuer für solche Anwendungen. Traditionelle SQL-Datenbanken sind zwar einfach zu bedienen, aber nicht für die Abfrage von Maschinendatenströmen in Echtzeit konzipiert.

NoSQL-Datenbanken sind notwendig

Oft gehen Datenbank-Experten bei hohen Datenmengen und unstrukturierten Daten davon aus, dass hier zwangsläufig ein NoSQL-Anwendungsfall vorliegt. NoSQL-Datenbanken eignen sich tatsächlich insbesondere bei komplexen und flexiblen Abfragen, weil sie für eine effiziente Skalierung und verteilte Architekturen bestens geeignet sind. Allerdings sind die Infrastrukturen von NoSQL oft sehr kompliziert aufgebaut, was viel Zeit für Planung, Betrieb und Administration verschlingt. In der industriellen Praxis wird fast immer auch die Speicherung von relationalen Daten gefordert wie z.B. Topologien, Firmware Informationen, ERP- oder Artikel-Daten. Das bedeutet, dass zwei Systeme parallel gefahren und synchronisiert werden müssen. Ein weiteres Problem ist, dass es keine standardisierte Abfragesprache für NoSQL-Datenbanken gibt, weil diese jeweils ihre eigenen Abfragesprachen haben. Es werden also jeweils spezialisierte, erfahrene Programmierer für NoSQL-Datenbanken wie Cassandra, Elasticsearch oder MongoDB benötigt – und die sind teuer und rar. Die Alternative liegt hier darin, reine NoSQL-Datenbanken durch neuere und modernere SQL-basierte Lösungen wie die CrateDB zu ersetzen, die die Vertrautheit von ANSI SQL mit der Skalierbarkeit und Flexibilität von NoSQL kombinieren.

Die Lösung liegt in Time-Series

Spezialisierte Zeitreihendatenbanken kommen immer wieder in Mode. Seit es Historians gibt, zeichnen sie Daten auf und können mithilfe integrierter Tools diese im Zeitverlauf grafisch darstellen bzw. abfragbar machen. Ein häufiger Fehler ist die Wahl einer Zeitreihendatenbank als Basis für eine IoT-Plattform. Denn wie die Praxis zeigt, sind Time-Series oft in ihrer Skalierbarkeit mit hoher paralleler Nutzung und auch Funktionalität eingeschränkt. Im IoT wird neben der Visualisierung von Datenströmen die Unterstützung bei einer Vielzahl von Analysen und Datenmodelländerungen gefordert, die beispielsweise zu verstehen ermöglichen, worin Ursachen für Auffälligkeiten liegen. Das interaktive Arbeiten mit Daten in Echtzeit ist also erforderlich – also auch unter hoher Last gleichzeitiges Lesen, Schreiben und Ausführen von adhoc Queries, wie z.B. für Machine Learning. Hinzu kommt die agile Anforderung Datenschemata zur Laufzeit anpassen zu können. Hierbei werden zu den nackten Sensordaten auch ERP-Daten, Qualitätsdaten oder Logistikdaten hinzugefügt, um anzuzeigen, ob Produktionsanomalien beispielsweise mit bestimmten Aufträgen verbunden sind oder auf Rohstoffe einzelner Lieferanten zurückzuführen sind. Datenmodelländerungen solcher Art erfordern häufig, dass Anwender ihre Zeitreihendatenbanken vollständig neu erstellen müssen, was zeit- und vor allem sehr kostenintensiv ist. Um das zu lösen, wird oft neben der Zeitreihendatenbank noch eine separate relationale Datenbank für Nicht-Zeitreihen-Daten eingesetzt. Das ist zwar eine schnell zu implementierende Lösung, allerdings wird es mit zunehmendem Wachstum der Datenbasis teuer und schwierig, die Daten in mehreren Datenbanken zu duplizieren und synchron zu halten.

KI ist erst mit bereinigten Daten möglich

Entwickler gehen manchmal davon aus, dass ihnen die Datenbasis oder Datenhygiene für das Aufsetzen einer KI fehlen. Unzureichende Daten könnten ja zu einer schlechten KI-gesteuerten Automatisierung führen. Die Befürchtung, unzulängliche Daten führten automatisch dazu, dass keine sinnnvollen Ergebnisse gewonnen werden können und Fehlentscheidungen getroffen werden, ist unbegründet. In der Praxis setzen die meisten Unternehmen eine Lösung wie CrateDB ein, um einen Echtzeit-Datenspeicher aufzubauen und mit KI-Technologien und maschinellem Lernen die menschliche Entscheidungsfindung zu optimieren, nicht um sie zu ersetzen. Eine praktische Herangehensweise ist es, die Daten im Prozess automatisch zu bereinigen, indem die Analyseergebnisse überwacht werden und so schrittweise ein sauberer Datenbestand entsteht. Der Versuch, zuerst alle historischen Daten als Voraussetzung für ein Projekt vollständig zu bereinigen, verzögert die Entwicklung und Implementierung von intelligenten IoT-Systemen und bietet oft zu wenige Daten oder Tiefe. Es ist in der Regel besser, einfach loszulegen und Rohdaten zu sammeln und auf dem Weg die Use-Cases zu entwickeln.

Resumée

Tatsächlich schafft IoT in der Praxis gänzlich neue Anforderungen an die Datenhaltung und -analyse. Pipelines von Sensordaten – oft tausende oder hundertausende von Messwerten pro Minute und Dutzende von Nachrichtenformaten – müssen in Echtzeit integriert und analysiert werden, um das Verhalten von ‚Dingen‘ zu überwachen, vorherzusagen oder zu kontrollieren. Eine schnelle Erfassung und Analyse von Maschinendaten sind die Voraussetzung, die datengesteuerte Automatisierung der Schlüssel zum Erfolg eines zukunftssicheren IoT-Projektes.

Ein Datenmanagementsystem in der Smart Factory muss:

  • Schnelle Entwicklung und Time-to-Value garantieren,
  • Echtzeit-Datenanalyse ermöglichen,
  • konstante Betriebszeit sowie
  • niedrige IT-Betriebskosten für Hosting, Integration und Administration gewährleisten.Die oben genannten Missverständnisse hingegen, halten Entwickler und Anwender nur von der Umsetzung der Smart Factory ab.
Ausgabe:
Crate.io GmbH
www.crate.io

Das könnte Sie auch Interessieren