Fünf Dimensionen der Datenqualität. Bild: Proalpha

Zehn Tipps für saubere Daten

  • 1. Bewusstsein für das Thema auf allen Ebenen schaffen:Die Bedeutung einer hohen Datenqualität muss im Bewusstsein der Mitarbeiter verankert werden. Erst wenn sich das Management darüber im Klaren ist, dass Business Intelligence ohne ‚Clean Data‘ nicht recht funktioniert, kann das strategische Ziel ’saubere Datenhaltung‘ erfolgreich ins Unternehmen getragen werden. Um die Mitarbeiter zusätzlich für das Potenzial einer sauberen Datenhaltung zu sensibilisieren, hilft es, konkrete Zielsetzungen zu formulieren. Diese können dann mit Datenqualitätsmanagement verfolgt werden, zum Beispiel die Verbesserung der Transparenz und Entscheidungsfindung im Unternehmen oder eine Stabilisierung der Kundenbeziehungen.
  • 2. Datenbestände analysieren, um deren Qualität einzuschätzen: Der Ausgangspunkt zur Datenbereinigung ist das Wissen um die tatsächliche Qualität der eigenen Daten. Um den Ist-Zustand zu erfassen und abzubilden, stehen heute wirkungsvolle Analysetools und -verfahren zur Verfügung. Diese können mit überschaubarem Aufwand Probleme identifizieren und die Fehlerhäufigkeit als Größenordnung benennen. Typischerweise kommen hier redundante Stammdaten, unvollständige Datensätze und fehlerhaft erfasste Daten ebenso an die Oberfläche wie Widersprüche zwischen verschiedenen Datenbeständen.
  • 3. Regeln definieren, wann Datensätze als ‚relevant‘ und ’sauber‘ einzustufen sind: Bevor es an die konkrete Datenbereinigung geht, sollten Regeln ausgearbeitet werden, die klare Maßstäbe vorgeben, welche Daten relevant sind und wie ein sauberer Datensatz auszusehen hat. Ist beispielsweise die E-Mail-Adresse erforderlich oder optional? Oder gilt bereits ein Datensatz mit Telefonnummer als vollständig? Aufgrund dieser Merkmale ist es möglich, den Datenbestand zu bewerten und festzulegen, was mit fehlerhaften Daten geschehen soll.
  • 4. Daten bereinigen und regelmäßig auf ihre Plausibilität hin untersuchen: Mit der systematischen Erstbereinigung fehlerhafter Daten lässt sich eine tragfähige Grundlage für eine dauerhafte Datenpflegestrategie schaffen – ‚make your data clean‘ heißt die Devise. Hier gilt es festzulegen, welches Qualitätslevel in welcher Zeit durch einen ersten Bereinigungslauf erreicht werden soll. Datenqualitätssicherung darf jedoch keine einmalige Angelegenheit bleiben – ‚keep it clean‘ lautet der Schlüssel zum langfristigen Erfolg. Um eine einwandfreie Datenqualität auch auf Dauer sicherzustellen, sollten Prozesse zu einer turnusmäßigen Qualitätskontrolle und Datenbereinigung etabliert werden. Leistungsstarke, ins ERP-System integrierbare Data-Mining-Tools unterstützen Unternehmen dabei mit zuverlässigen Datenqualitätsanalysen ohne großen Aufwand.
  • 5. Eindeutige Verantwortlichkeiten für Dateninhalt und Datenpflege definieren: Für eine konsistente und redundanzfreie Datenhaltung sollten Verantwortliche für die Datenqualität in den Fachabteilungen, aber auch für das Gesamtunternehmen benannt werden. Klare Verantwortlichkeiten – für die Dateneingabe und Fehlerbereinigung – vermeiden verteilte Zuständigkeiten und eine partikuläre Datenhaltung in parallelen Datenbanken, die laufend synchronisiert und auf Redundanzen geprüft werden müssten. Zugleich benötigen die Verantwortlichen für Datenpflege aber auch Handlungsfreiräume und Zugang zum Management, um Verbesserungen anstoßen und durchsetzen zu können.
  • 6. Qualitätssicherung schon bei der Datenerfassung: Viele Fehler lassen sich durch einfache Maßnahmen direkt bei der Dateneingabe vermeiden. Situationsgerecht auf die Anwender zugeschnittene Eingabemasken sowie eine intuitiv zu bedienende Benutzeroberfläche schaffen die Grundlage für eine korrekte Datenerfassung. Ergänzend helfen in ERP-Systemen automatisierte Plausibilitäts- und Vollständigkeitsprüfungen der Feldinhalte, bei der Dateneingabe Anwenderfehler zu vermeiden.
  • 7. Verbindliche Vorgaben für eindeutige und kurze Artikelbezeichnungen machen: Dubletten lassen sich durch sorgfältig ausgearbeitete Sachmerkmal-Leisten (SML) und treffende, eindeutig verständliche Produktbezeichnungen vermeiden. Abkürzungen etwa sind tabu. Darüber hinaus ist es hilfreich, alle Vorgaben von den Key-Usern auf Herz und Nieren prüfen zu lassen und gegebenenfalls den mehrheitlichen Nutzergewohnheiten anzupassen.
  • 8. Möglichst viele Daten automatisch beziehungsweise über definierte Workflows erfassen: Durch integrierte Abläufe fließen bereits viele Daten automatisch ins System ein, beispielsweise wenn Lagerbewegungen per Transponder überwacht werden. Zudem lässt sich IT-gestützt sicherstellen, dass notwendige Informationen auch abteilungsübergreifend vollständig zusammengetragen und erfasst werden. ERP-Systeme können dies durch vollautomatische Workflows ermöglichen. Ein Beispiel: Legt ein Vertriebsmitarbeiter neue Kundenstammdaten an, so fordert ein entsprechender Workflow automatisch den zuständigen Sachbearbeiter auf, die ausstehende Kreditwürdigkeitsprüfung durchzuführen. Gleichzeitig erhält der Mitarbeiter in der Finanzbuchhaltung den Auftrag, den Kontenstamm zu pflegen. Sind diese beiden Schritte abgeschlossen, informiert der Workflow automatisch den Mitarbeiter, der für die Vergabe von Kreditlimits verantwortlich ist. Wenn dieser vordefinierte Prozess durchlaufen wurde, ist zuverlässig sichergestellt, dass die Datenanlage vollständig abgeschlossen ist.
  • 9. Datenbestände durch gezielte Archivierung verkleinern:Je umfangreicher der Datenbestand wird, desto schwieriger kann es sein, diesen in durchgängig hoher Qualität zu verwalten und im Tagesgeschäft effektiv zu nutzen. Enthält beispielsweise eine Kundendatenbank 50 Prozent inaktive Kontakte, so müssen diese mitgepflegt werden, um die Daten konsequent aktuell zu halten. Ziel sollte es daher sein, das Datenvolumen auf das Nötigste zu reduzieren. Einige IT-Lösungen unterstützen hier beispielsweise mit Hilfe einer automatisierten Stammdatenarchivierung.
  • 10. Regelmäßige Schulung der Mitarbeiter: Auch wenn die Mitarbeiter aktiv ins Datenqualitätsmanagement eingebunden sind, sollten sie regelmäßig geschult werden. Zum einen bleibt so das Thema Datenqualität im Tagesgeschäft präsent. Zum anderen lässt sich auf diese Weise sicherstellen, dass Faktoren, die nicht über Automatismen zu regeln sind, durchgängig beachtet werden – darunter beispielsweise Vorgaben zu einheitlichen Schreibweisen oder zur Genauigkeit von Zeitbuchungen.

Datenqualität kostet Geld

Datenqualität herzustellen und konsequent zu sichern, kostet Geld. Mangelnde Datenqualität kann mittelfristig jedoch noch mehr kosten. Da sich die tatsächlichen Kosten fehlerhafter, unvollständiger und redundanter Daten jedoch nur schwer beziffern lassen, zögern viele Unternehmen Investitionen in ein gezieltes Datenqualitätsmanagement weiter hinaus. Die Investitionen in die Datenqualität sind nicht mit einem Return on Investment zu verbinden. Sie kann aber Voraussetzung sein, um das Geschäftsmodell erfolgreich weiterzuentwickeln und Wettbewerbsvorteile zu erzielen. Unternehmen sollten Datenqualität daher zu einem strategischen Ziel machen. Denn Daten sind die DNA eines Unternehmens.