Konzepte zum Daten speichern

Kosten sparen mit Tiered Storage

Mit der steigenden Anzahl an Edge-Computing-Infrastrukturen in der Industrie steigt der Bedarf an der Speicherkapazität vor Ort. Mit Software und dem Tiered Storage-Ansatz können Unternehmen sicherstellen, Datensätze auf der passenden Speicherhardware abzulegen – die sich in Zugriffzeit und Kosten pro Terabyte deutlich voneinander unterscheiden.

(Bild: ©miklyxa/stock.adobe.com)
(Bild: ©miklyxa/stock.adobe.com)

Wohl alle Studien zum weltweiten Datenverkehr messen einen starker Anstieg – und die meisten dieser neuen Daten erzeugen IoT-Geräte in Edge-Infrastrukturen. Obwohl also mittlerweile die meisten Daten dezentral am Rand des Netzwerks generiert werden, ist die Rechen- und Speicherinfrastruktur in der Regel noch in einigen wenigen großen Rechenzentren oder in der Public Cloud gebündelt. Bei dieser Vorgehensweise müssen die Daten zur Verarbeitung und Speicherung dorthin übertragen werden, was zu Verzögerungen und Kosten führt.

Industrielle Bildverarbeitung

Für die Industrie besonders interessante Aspekte sind die KI-gestützte Optimierung und Automatisierung von Produktionsschritten. Dabei fallen insbesondere bei Machine Vision-Anwendungen viele Daten an, mit denen beispielsweise Funktionsstörungen und Produktionsfehler erkannt werden. Bei Machine-Vision-Applikationen werden aktuell viele Daten, die in der Edge gesammelt werden, zur Verarbeitung und zum Training von KI-Modellen an ein zentrales Rechenzentrum übertragen. Es entstehen aber auch neue Systemarchitekturen, die eine Datenverarbeitung in der Edge ermöglichen, was Anwendungen mit hohen Anforderungen an die Latenzzeiten ermöglicht. Der Einsatz von Edge Analytics und der Technik des sogenannten föderalen Lernens im Kontext von Maschinellem Lernen bringt bemerkenswerte Vorteile mit sich. Viele Sicherheits- und Datenschutzmängel zentralisierter Systeme können überwunden werden, wenn Daten das Werk gar nicht erst verlassen.

Dezentrale Strukturen

Obwohl dezentrale IT-Infrastruktur-Konzepte viele Vorteile bieten, haben sie auch einige Nachteile. Die Auswahl der Speicher- und Datenverarbeitungsinfrastruktur in der Edge ist deshalb entscheidend. Hier die passende Entscheidung zu treffen, hat erhebliche Auswirkungen auf die Effizienz des Gesamtsystems und seine Betriebskosten. Es muss dabei auch die zentrale Verwaltung der Edge-Infrastruktur sichergestellt sein und es müssen Details beim genauen Einsatzszenario berücksichtigt werden.

Tiered Storage

Eine Methode für das Datenmanagement ist in diesem Kontext der Einsatz einer Systemarchitektur mit Tiered Storage. Aber was genau ist Tiered Storage? Kurz gesagt beschreibt Tiered Storage oder auch Storage Tiering eine Methode zur Kategorisierung von Daten auf der Grundlage ihres Wertes für das Unternehmen. Außerdem ist die Zugriffshäufigkeit ausschlaggebend. Die Daten werden dabei bestimmten Speicherebenen, sogenannten Tiers, zugeordnet. Diese unterscheiden sich hinsichtlich Performance, Verfügbarkeit und Kosten.

Daten mit Lebenszyklus

Genau wie eine gute Geschichte haben auch Daten im übertragenen Sinn einen Anfang, eine Mitte und ein Ende. Je nachdem, wo sich die Daten in ihrem Lebenszyklus befinden und welchen aktuellen Wert sie für ein Unternehmen haben, können sie als heiße Daten (Hot Data), warme Daten (Warm Data) oder kalte Daten (Cold Data) klassifiziert werden. Daten, die täglich abgerufen und aktiv genutzt werden, nennt man heiße Daten. Außerdem gibt es warme Daten, auf die regelmäßig, aber nicht täglich zugegriffen werden muss. Viele Unternehmen, die große Mengen an unstrukturierten Daten speichern, verlassen sich oft auf Netzwerkspeicher (NAS) oder die Public Cloud. Die Einbeziehung von Tiered Storage kann jedoch zu geringeren Kosten beitragen. Heutzutage betten Storage-Anbieter automatisierte Tiering-Software in ihre Software-Management-Stacks ein. Je nach den von den Unternehmen definierten Richtlinien kann diese Software in Echtzeit die für die Daten geeignete Speicherebene (Tier) und das geeignete Speichermedium bestimmen.

Passende Speichertechnologie

Bei Tiered Storage werden die Daten während der aktiven Nutzzeit (z.B. Datenverarbeitung und -analyse) auf einem schnellen Speicher abgelegt. Eine Sicherungskopie dagegen wird auf einem kostengünstigeren Speicher, etwa auf Tape- oder Objektspeicher, archiviert. Die Kosten der Datenspeicherung sind ein wesentlicher Faktor, der berücksichtigt werden muss. Günstiger Speicher kostet nur ca. 44 Euro pro Terabyte. Allerdings dauert es bei dieser Variante unter Umständen zu lange, bis die Daten abgerufen werden können. Deshalb muss ein Gleichgewicht zwischen Kosteneffizienz einerseits und einer hohen Zugriffsgeschwindigkeit auf wichtige Daten andererseits gefunden werden. In den meisten Fällen müssen Daten auf unbestimmte Zeit aufbewahrt werden. Das ist z.B. im Bereich des autonomen Fahrens der Fall. Diese Archivdaten werden mitunter nur selten verwendet und können daher auf der niedrigsten, das heißt günstigsten, Ebene gespeichert werden. Die in der Fertigungsindustrie erzeugte Datenmenge dürfte auch in Zukunft steigen. Damit die Speicherungskosten nicht in die Höhe schnellen, sollten sich Hersteller ein zukunftsfähiges Konzept erarbeiten. In diesem Zusammenhang stellt der Tiered Storage-Ansatz eine sehr gute Komponente dar.