Systemarchitektur für Advanced Analytics

Zukunftssicher im Data Lake

Entscheiden sich produzierende Unternehmen für die Integration eines Data Lakes, muss dieser strategische Schritt langfristig und intensiv geplant werden. Doch im Erfolgsfall verfügen die Hersteller über eine Technologie, die künftig das Maß der Dinge für die Speicherung und Auswertung von Daten darstellen könnte.

Bild: ©metamorworks/stock.adobe.com
Bild: ©metamorworks/stock.adobe.com

In unserer schnelllebigen Zeit haben Daten dem Öl den Rang als wertvollstes Gut der Welt abgerungen. Der Umgang mit ihnen ist Grundlage für Erfolg in nahezu allen Industrien. Gleichzeitig ist hohes Datenvolumen heute eine Herausforderung für die Industrie. Für das Jahr 2025 prognostiziert die EU-Kommission ein Datenvolumen von 175 Zettabyte. Diese Daten enthalten Informationen über Produktionsprozesse, Lieferketten, Kundenverhalten, Markttrends und vieles mehr. Doch von den industriellen Daten werden nur wenige tatsächlich genutzt. Gleichzeitig ist die Erfassung, Speicherung und Verarbeitung von Daten in monolithischen Applikationen wie dem Prozessleitsystem (PLS) oder Manufacturing Execution System (MES) nicht effizient. Oft ist dieselbe Information in mehreren Systemen vorhanden oder muss mit großem Integrationsaufwand erschlossen werden.

Flexible Datenhaltung möglich

Wäre es nicht möglich, stattdessen die Systeme zu den Daten zu bringen? Dieser Ansatz ermöglicht eine einheitliche Grundlage für Prozesse, Innovationen und Geschäftsmodelle, die das Potenzial der Daten ausschöpft. Ein Data Lake stellt eine Stufe auf diesem Weg dar. Im Gegensatz zu traditionellen Datenbanken, bietet der Data Lake eine flexible und skalierbare Umgebung, die es Nutzern ermöglicht, verschiedene Datenformate in großen Mengen zu speichern. Er eröffnet eine strategische Initiative hin zu einer konsequent neu gedachten Datenarchitektur.

Datenschicht der Fabrik

Doch wie sieht dieser Data Lake im industriellen Umfeld genau aus? In ersten Umsetzungen besteht der Data Lake aus einer parallelen Datenhaltungsstruktur, in die Daten nach ihrer Verwendung in den jeweiligen Quellsystemen übertragen werden. In einer vollständig umgesetzten Data-Lake-Architektur bildet der Data Lake jedoch den Datenlayer sämtlicher am Produktionsprozess beteiligter Applikationssysteme wie MES, PLS und Batch-Systeme sowie Steuerungssysteme für mobile Roboter. In traditionellen Architekturen verfügen diese Systeme über eigene, relationale Datenbanken. In einem voll ausgebauten Data-Lake-Szenario speisen die angebundenen Applikationssysteme ihre Daten bereits zum Zeitpunkt ihrer ersten Erfassung in den Data Lake ein. Sie stehen damit auch anderen Systemen früher zur Verfügung, was die Transparenz während der Produktion erhöht.

Data-Lake-Architektur mit angrenzenden Systemen (Bild: SpiraTec AG)
Data-Lake-Architektur mit angrenzenden Systemen (Bild: SpiraTec AG)

Daten, Metadaten, Integration

Die Menge an Daten, die dabei in hoher Frequenz ein- und ausgelesen werden, machen eine verteilte Architektur mit mehreren, skalierbaren und sich gegenseitig replizierenden Instanzen sinnvoll. Zudem speichern Data Lakes viele verschiedene Datenformate wie Tabellen- und Zeitreihendaten, aber auch Alarme und Events, mediale Informationen wie Video-, Sound- oder Bildaufnahmen, Dokumente und Data Streams. Diese Bandbreite an Formaten innerhalb einer SQL-Datenbank abzubilden, wäre dagegen aufwendig und würde die Performanz der Datenbank einschränken. Um die Datenschicht des Data Lakes schließt sich eine Kontextualisierungsschicht. In dieser Schicht werden die aus ihren jeweiligen Quellen einströmenden Daten mit Meta-Daten angereichert und zu den bereits vorhandenen Daten in Beziehung gesetzt. Die äußerste Schicht des Data Lakes bildet die Integrations- und Data-Ingestion-Layer. Diese Schicht hält den Kontakt zu Datenquellen sowie Applikationssystemen und macht die Heterogenität von Produktionslandschaften beherrschbar.

Schlankere Anwendungen

Das Data-Lake-Konzept wirkt sich auch auf die produktionsbeteiligten Systeme aus. Statt beispielsweise Auftragsverwaltungsdienste in verschiedenen Systemen wie dem MES und PLS zu betreiben, kann ein einziger Dienst über die ISA-95-Ebenen hinweg Aufträge verwalten und die Daten im Lake bereitstellen. Die Applikationssysteme werden also schlanker, spezialisierter und können als Verbund auf einer gemeinsamen Informationsbasis miteinander interagieren. Ein so umgesetzter Data Lake bietet zahlreiche Vorteile und Chancen. Durch den Data Lake kann eine einheitliche Datengrundlage im Produktionsumfeld entstehen. Das Risiko von inkonsistenten Daten entfällt und Data Integrity ist einfacher sicherzustellen. Die Applikationen können kleiner und modularer werden und befreien Unternehmen von der Notwendigkeit großer Monolithen in der Systemlandschaft. Diese schlankeren Applikationen können beispielsweise stärker von der physischen Anlage entkoppelt werden, indem sie auf einem durch den Data Lake abgebildeten Digital Twin arbeiten. Dadurch lassen sich die Systeme leichter in Cloud-Architekturen betreiben. Wer die Applikationen auf Cloud-Servern betreibt, kann dieselben Systeme leichter in allen Standorten und Bauten des Unternehmens einsetzen. Damit muss das Personal insgesamt eine geringere Anzahl Systeme erlernen.

Deutlich weniger Schnittstellen

Weitere Kosten sparen Firmen durch den Wegfall aufwendiger Punkt-zu-Punkt-Integration. Vertikale Integration ist heute häufig verbunden mit hohen Kosten und Middleware-Systemen zu erreichen. In der Data Lake-Architektur muss jedes System lediglich an den zentralen Datenpool angeschlossen werden, um am Verbund der Produktionssysteme teilzunehmen. Dieser Ansatz öffnet auch KMUs die Möglichkeit, vertikal integriert zu produzieren und etwa Industrie 4.0-Anwendungen zu realisieren.

Skalierbare Datenräume

Für die verteilte Architektur des Speichers ist auch die Zunahme anfallender Datenmengen kein Problem. Eine dynamische Skalierung ermöglicht es Unternehmen, ihre Dateninfrastruktur an wachsende Anforderungen anpassen zu können. Data Lakes bieten außerdem eine gut geeignete Umgebung für fortgeschrittene Analysen. Dort können Muster, Trends und Zusammenhänge in den Daten erkannt werden. Unternehmen können so Einblicke gewinnen, die zur Optimierung von Prozessen oder zur Identifizierung von Chancen genutzt werden können. Auch für Initiativen wie Manufacturing-X, in der verschiedene Unternehmen Daten über die gesamte Lieferkette gemeinsam nutzen, bietet der Data Lake eine Datengrundlage. Gleichzeitig bleibt die Souveränität über die eigenen Daten erhalten.

Datenqualität im Blick halten

Die Einrichtung des Data Lakes geht mit einigen Herausforderungen einher. Eine bedeutende Schwierigkeit besteht darin, die Datenqualität sicherzustellen und die Datenstruktur klar zu etablieren. Strukturen, Integrität und Metadatenmanagement verringern das Risiko, einen sogenannten Data Swamp einzuführen. In solchen Datensümpfen fehlen die Strukturen zur Datenaufbereitung, was zu einer schwer interpretierbaren oder fehlerhaften Datengrundlage führt. Industrielle Systeme erzeugen zudem viele Daten in Echtzeit, was eine hohe Performanz erfordert. In kritischen Prozessen kann eine Verzögerung bei der Datenverarbeitung jedoch schwerwiegende Folgen haben. Für die kritischen Daten sollten also individuelle Lösungen gewählt werden. Diese machen allerdings nur einen Bruchteil der Prozessdaten aus.

Mitwachsende Infrastruktur

Data Lakes müssen in der Lage sein, zu skalieren, um auch steigende Datenmengen verarbeiten zu können. Dazu ist eine kontinuierliche Bewertung und Anpassung von Soft- und Hardware erforderlich. Auch die Anwendungen zur Datenanalyse müssen effektiv eingesetzt werden, damit sie zeitnah Ergebnisse liefern. In streng regulierten Branchen wie der Pharma- oder der Chemieindustrie ist außerdem zu beachten, dass die Datenmenge durch behördliche Anforderungen wie einem Audit Trail ansteigt. Das kann den Data Lake in seiner Größe und dem Handling signifikant beeinflussen.

Externe Unterstützung suchen

Der Weg zur Data-Lake-Architektur führt über strategische Planung sowie passende Ressourcenallokation und Herangehensweise. Qualifizierte externe Unternehmen können dabei unterstützen. Etwa indem die Dienstleister personelle Engpässe beim Betreiber abfedern sowie mit ihren externen Sichtweisen und Erfahrungen wertvolle Erkenntnisse einbringen und Betriebsblindheit vermeiden helfen. Passende Unternehmen sollten die gesamte Bandbreite der erforderlichen Erfahrungen und Kompetenzen mitbringen. Insbesondere die Verknüpfung von modernen IT-Technologien, Prozessautomatisierung und gegebenenfalls regulatorischen Anforderungen ist wichtig. Weiter erforderlich sind Kenntnisse über Konzeption und marktübliche Systeme, sowie Umsetzungserfahrung, um gegebenenfalls auch in dieser Phase das Vorhaben zu unterstützen. Zudem ließe sich das externe Unternehmen für den langfristigen Service und die Wartung ins Haus holen.

Tipps zur Projektierung

Beginnt ein Produktionsunternehmen mit der Integration eines Data Lakes, sollte es zunächst Ziele, Abgrenzungen und Anwendungsfälle definieren. Die Anforderungsanalyse stellt sicher, dass der Data Lake auch die Bedürfnisse des Unternehmens erfüllt. Auf Basis der Analyse wird geplant und die Data Layer der eingesetzten Applikationen mit dem Data Lake harmonisiert. Für jede Applikation wird überprüft, welche Daten von welcher Quelle bezogen werden. So können Daten, die in unterschiedlichen Systemen vorliegen, im Data Lake zusammengeführt werden. Konsequente Data-Lake-Konzepte verbinden Daten aus mehreren Ebenen der ISA-95-Pyramide. Diese Ebenen werden in Produktionslandschaften in einer segregierten Netzwerkarchitektur abgebildet. Also müssen Betreiber Daten aus verschiedenen Ebenen integrieren können. Einen vielversprechenden Ansatz stellt die Namur Open Architecture (NOA) dar. Wer einen modernen Data Lake im Unternehmen einführen möchte, für den lohnt sich der Blick in die entsprechenden Namur-Empfehlungen (NE175-NE179). Neben den Methoden zum Erschließen der Daten berücksichtigt die Veröffentlichung auch Sicherheitsaspekte und stellt ein Informationsmodell zur Verfügung.

Zukunftssicher aufgestellt

Ähnlich wie beim Öl müssen Daten raffiniert werden, um Wert zu generieren. Für diese Aufbereitung bietet sich ein Data Lake als Plattform an. So werden Daten zu Informationen und diese zu Wissen. Wissensbasierte Entscheidungen wiederum sind eine zentrale Voraussetzung, um unternehmerische Erfolge zu sichern und auszubauen.







  • Lohnt sich ein Retrofit?

    Oft ist unklar, ob es sich lohnt, ältere Maschinen mit neuen Sensoren auszustatten. Im Projekt ‚DiReProFit‘ wollen Forschende dieses Problem mit künstlicher…


  • MVTec eröffnet Niederlassung in Taiwan

    Bereits seit 2020 unterhält MVTec ein Vertriebsbüro in Taiwan. Dieses wertet der Bildverarbeitungsspezialist nun zu einer eigenen Niederlassung, der MVTec Taiwan, auf.


  • Ein Stück näher am Quanteninternet

    Das Quanteninternet verspricht signifikante Verbesserungen in verschiedenen technologischen Schlüsselbereichen. Um dieses jedoch im bestehenden Glaserfasernetz zu realisieren, sind Quantenfrequenzkonverter nötig, die die…


  • KI in Fertigungsbranche vorn

    Die neunte Ausgabe von Rockwell Automations „State of Smart Manufacturing“ Report liefert Einblicke in Trends und Herausforderungen für Hersteller. Dazu wurden über…


  • MES-Integrator und 360-Grad-Partner für optimierte Fertigung

    Das Manufacturing Execution System (MES) HYDRA optimiert Produktionsprozesse für Fertigungsunternehmen, um Wettbewerbsvorteile zu erzielen.