Anzeige
Anzeige
Anzeige
Anzeige
Beitrag drucken

Datenmanagement

Dark Data – die dunkle Seite des Wissensmanagements

Der Begriff Dark Data lässt aufhorchen, klingt er doch nach Unheil. Ganz falsch liegt man mit dem ersten Eindruck nicht. Die dunklen Daten bergen tatsächlich Risiken für Unternehmen. Allerdings besteht die Kerngefahr nicht etwa darin, dass sie illegal sind – sondern, dass sie bislang als unkontrollierbar galten. Wie können Unternehmen sie sich sogar zunutze machen?

Dark Data

Bild:©Sven Hoppe/Fotolia.com

Bei der Diskussion um Big Data wird oft übersehen, dass die Schere zwischen der Menge an nützlichen Daten und der Verarbeitungskapazität immer größer wird. Das belegen auch neue Erhebungen des IDC-Instituts, welches davon ausgeht, dass die Gesamtmenge gesammelter Daten weltweit von rund 8,6 Zettabyte im Jahr 2015 auf rund 44 Zettabyte im Jahr 2020 anwachsen wird. Das entspricht etwa dem 50-fachen Wachstum zwischen 2010 und 2020. Eine exponentiell wachsende Herausforderung.

Big, Bigger, Dark Data

Die IT-Experten können sich also über einen Mangel an Input nicht beschweren. Grundsätzlich bleibt eine aussagekräftige Analyse aber nach wie vor eine echte Mammutaufgabe. Ein Großteil dieses Informationsberges wird derzeit nicht ausgewertet, weil vielen Unternehmen die entscheidenden Lösungen fehlen. Wie wichtig die Lokalisierung der Daten ist, lässt sich schon an einer Kategorisierung veranschaulichen. Dazu lassen sich Daten in drei Gruppen unterteilen:

  • Geschäftskritische Daten – Hierbei handelt es sich um Daten, die offenkundig wichtig für den Betrieb und Unternehmenserfolg sind. Sie stellen dabei – entgegen der weitverbreiteten Meinung – nicht den Großteil des Datenvolumens dar. Sie werden aber am meisten genutzt, da sie sich leicht erheben und messen lassen. Laut dem Databerg-Report von Veritas Technologies sind sie mit 15 Prozent Anteil an der Gesamtdatenmenge vergleichsweise überschaubar.
  • ROT-Daten – ROT steht für Redundant, Obsolet, Trivial. Diese Daten stellen keinen Geschäftswert dar und sollten daher regelmäßig gelöscht werden. Hierzu zählen vor allem Spam, Werbung oder Phishing-Mails. Sie entsprechen ungefähr 19 Prozent in Deutschland, der europäische Schnitt liegt bei 32 Prozent.
  • Dark Data – Bei Dark Data handelt es sich nicht etwa um illegale Informationen, sondern um ungenutzte und unstrukturierte Daten, die in den Untiefen der Speicherplattformen schlummern. Ihr Wert ist noch nicht identifiziert, daher kann sich später herausstellen, dass unter ihnen sowohl geschäftskritische- als auch ROT-Dateien sind.

Dark Data ist überall

Dark Data sind demnach betriebliche Informationen, die an unterschiedlichen Stellen und Geräten anfallen. Sie werden entweder gar nicht oder nicht ausreichend betrieblich zielführend ausgewertet. Nehmen wir als Beispiel Log-Dateien von Servern. Sie werden in aller Regel angelegt und gespeichert um im Fall der Fälle Fehler des Servers analysieren und beheben zu können. Gleichzeitig werden sie auch eingesetzt, um die Wirksamkeit von Sicherheitsmaßnahmen checken zu können – also nachträglich zu prüfen, ob jemand Sicherheitsmaßnahmen austricksen konnte und unbefugt auf Daten zugegriffen hat.

Unstrukturierter Datenwust birgt Gefahren für Firmen

Diese dunklen Daten ließen sich aber auch für weitere betriebliche Zwecke auswerten. Unternehmen könnten zum Beispiel die Inhalte und Services ihrer Webseite auf Grundlage dieser Daten optimieren, wozu in der Praxis regelmäßig jedoch zusätzliche Tools eingesetzt werden, die unabhängig von den vorhandenen Daten eigene Datensilos anlegen und nutzen. Abseits von der wirtschaftlich effizientesten Nutzung von Daten müssen Unternehmen natürlich auch Risiken dieser Daten erkennen und minimieren. Dabei müssen diese Datenmassen zuerst vor unbefugtem Zugriff geschützt werden. Wenn sie für das eigene Unternehmen einen Wert haben könnten, dann werden sie schließlich auch für andere Unternehmen – in jedem Fall aber für spezialisierte kriminelle Organisationen – einen Wert darstellen. Einige Datensätze könnten brisante Informationen über die Organisation enthalten oder sogar gegen bestehende Compliance-Regeln verstoßen. Der Dieselgate-Skandal hat der ganzen Welt demonstriert, wie zuviel Unwissenheit über die eigenen Daten sogar einen Konzern ins Wanken bringen kann.

Achtung bei Personendaten

Wenn die Daten sich auf Personen beziehen, also beispielsweise Mitarbeiter oder Kunden, besteht über das eigene unternehmerische Risiko hinaus die Pflicht, diese Daten zu kontrollieren. Das heißt schon die Speicherung dieser Art von Daten sollte mit den entsprechenden Experten wie dem Datenschutzbeauftragten besprochen sein. Die tatsächliche Nutzung und Auswertung dieser Daten sollte ebenfalls in enger Abstimmung mit dem Datenschutz und auch mit den Mitbestimmungsgremien erfolgen, wie dem Betriebsrat. Denn unter Umständen führen die angefallenen Daten zu Informationen über Social Skills wie Teamfähigkeit oder kommunikative Kompetenzen von Mitarbeitern. Das Management wird durch die Einbindung aller Akteure in der Lage sein, eine ausgewogene datengetriebene HR-Strategie zu entwickeln, die sich auf die effiziente Nutzung der notwendigen Daten beschränkt.

Funzeln statt Flutlicht

Unternehmen aus Deutschland schneiden vor allem im Kostenvergleich zu den USA schlecht ab. Demnach wendet ein hiesiges Unternehmen pro 1.000 Terabyte an Daten jährlich 594.000 Euro auf, um triviale Daten zu verarbeiten, die irrelevant für das Geschäft sind. Langsam wird den Organisationen dieser Umstand aber bewusst, jedoch fehlt es häufig noch an einer ganzheitlichen Lösung, um die Datenmassen möglichst früh in werthaltige und wertlose Daten zu trennen.

Wie geht man vor?

Bisher haben die IT-Strategien auf zusätzliche Ressourcen wie Speichervolumen gesetzt, die immer schneller verarbeitet werden konnten. Doch es könnte der Zeitpunkt kommen, besser zwischen Nutzen und Risiko der anfallenden Daten unterscheiden zu müssen. Das Management kann dafür stärker auf Lösungen wie Enterprise Search setzen und flexible Information Governance-Strategien entwickeln, um die dunklen Daten transparent und messbar zu machen. Konkrete Anwendungen sind dabei FA-Tools in Kombination mit e-Discovery für eine spezifische Abtastung der dunklen Daten. Solche Dark Analytics müssen jedoch mit stringenten Definitionen genau auf das Firmenprofil zugeschnitten werden – sie sind Taschenlampen im Dunkeln, keine Flutlichter! Im Ergebnis wird nicht nur effizienter mit wertvollen Firmenressourcen umgegangen, sondern auch IT-Risiken aktiv kontrolliert.


Das könnte Sie auch interessieren:

Im Juli lagen die Auftragseingänge in der deutschen Elektroindustrie um 1,9% unter ihrem Vorjahreswert. Die Inlandsbestellungen gaben um 1% nach, die Auslandsbestellungen um 2,5%.‣ weiterlesen

Mit der Inbetriebnahme eines IBM Q System One wollen IBM und die Fraunhofer-Gesellschaft das Thema Quantencomputing für die Industrie vorantreiben. Durch die Kooperation entsteht zudem ein neues Kompetenzzentrum für Quantentechnologie.‣ weiterlesen

Das neue Siemens Opcenter der Softwaresparte des Münchener Technologieunternehmens bringt zahlreiche Anwendungen wie Camstar, Simatik IT und Preactor in einer einheitlichem Umgebung und Benutzerführung zusammen. René Wolf von Siemens Digital Industries Software schildert, was die Kunden davon haben - und was sich funktional getan hat.‣ weiterlesen

Der Schärfspezialist Vollmer stellt auf der Emo Hannover seine Digitalinitiative V@dison in den Mittelpunkt. In Halle 6, Stand F66 finden Besucher das neu entwickelte IoT-Gateway des Herstellers. Schleif- und Erodiermaschinen lassen sich damit plattformunabhängig in IoT-Umgebungen einbinden.‣ weiterlesen

Die Landschaft für Endgeräte zur mobilen Datenerfassung hat sich im letzten Jahrzehnt fast genauso rasant entwickelt wie im Consumer-Bereich. In der Lagerlogistik oder der Produktion zählen neben Stapler-Terminals gerade mobile Handhelds zu den gängigsten Gerätetypen. Um aber das passende Gerät für das eigene Unternehmen zu identifizieren, lohnt der Blick auf die mobilen Prozesse, die Integration in die Unternehmens-IT und vor allem die Arbeitsumgebung der Mitarbeiter.‣ weiterlesen

In Wertanalyseprojekten erfolgt eine Bewertung an vielen Stellen des Arbeitsplans. Die VDI-Richtlinienreihe 2808 hilft, reproduzierbare Ergebnisse durch strukturierte Vorgehensweisen zu erzielen und diese Ergebnisse kundenorientiert darzustellen.‣ weiterlesen

Auf der diesjährigen Emo präsentiert die HSi GmbH ihre Softwarelösungen zur automatisierten Planzeit- und Kostenermittlung, Arbeitsplanerstellung sowie Auftragssteuerung. Am Stand C20 in Halle 9 werden auch Erweiterungen des Systems zu sehen sein, etwa bei der Zeitübergabe an SAP: Werden im Stufeneditor NC-Grundzeiten in den Rüst- und Spannbausteinen eingegeben, erfolgt die Summierung dieser Zeiten parallel zu den Hauptzeiten (th), Nebenzeiten (tn) und Grundrüstzeiten (trg).‣ weiterlesen

Obwohl das MQTT-Protokoll bereits seit etwa zwei Jahrzehnten existiert, ist es durch sein Konzept bestens für moderne IIoT-Anwendungen geeignet. Vor allem für solche, die sich auf eine aktive Benachrichtigung stützen. Also dort, wo Geräte nur bei Bedarf Daten bereitstellen und nicht regelmäßig, wie bei der passiven Benachrichtigung. Doch wie lässt sich der Erfolg von MQTT im IIoT erklären, und was sollte man vor dem Einsatz des Übertragungsprotokolls wissen?‣ weiterlesen

Auf der Emo zeigt TDM Systems (Halle 9, Stand F24) erstmals den TDM WebCatalog einer breiten Öffentlichkeit. Ab August steht die Cloud-Anwendung nach Registierung den Anwendern von TDM Global Line 2019 und TDM 2019 (und höher) zur Verfügung.‣ weiterlesen

DMG Mori wird auf der Emo in Halle 2, Stand A21 über 30 digitale Innovationen zeigen. Darunten sind neue Celos APPs, Werkzeuge zum Monitoring, der Produktionsplanung und -steuerung sowie webbasierte Instandhaltungstools.‣ weiterlesen

Nachdem Produzenten schon ihre Waschmaschinen, Kühlschränke und Rollläden IoT-fähig ausliefern, wollen viele auch im eigenen Werk von der Vernetzung profitieren. Anhand eines beispielhaften Projektes klärt dieser Beitrag, wie das schnell und günstig gelingen kann.‣ weiterlesen

Anzeige
Anzeige
Anzeige