Firmenwissen organisieren

Wissensverluste mit OCR vermeiden

Wissensmanagement sichert Wettbewerbsvorteile und den langfristigen Erfolg von Unternehmen. Organisationen sehen sich jeden Tag mit Dark Data konfrontiert. Darunter fallen eine Vielzahl an eingehenden Informationen, täglich neu erstellten Dokumenten und unstrukturierten Datenmengen. Wer diese Ressourcen mithilfe intelligenter Technologien zu nutzen weiß, wird langfristig Wettbewerbsvorteile sichern.

Bild: Abbyy Europe GmbH
Bild: Abbyy Europe GmbH

In Unternehmen fallen große Mengen an Dokumenten an: Konstruktionspläne, Patente, Dokumente zum Produktlebenszyklus, Verträge, Fertigungslisten, Forschungs- und Testdokumentationen. Hinzu kommen Kundenkommunikation, Dokumente für Vermarktung sowie Buchhaltung oder Warenwirtschaft. Digitale Dokumentenmanagementsysteme (DMS) haben die Aufgabe, alle diese Dokumente unter Einhaltung externer und interner Regeln zu verwalten, um das Wissen der Organisation zu strukturieren. Dokumente und Informationen aus verschiedenen Quellen werden zentralisiert und für alle Fachkräfte erreichbar.

Nur digital reicht nicht aus

Der erste ‚digitale Schritt‘ – das Einscannen – genügt nicht, um die im Dokument vorhandenen Informationen zu erreichen. Denn Texte in gescannten Dokumenten sind elektronisch weder durchsuchbar noch können die enthaltenen Daten automatisch in nachgelagerte Geschäftsprozesse eingespeist werden. Technologien zur Dokumentenumwandlung und Texterkennung (OCR) schaffen hier Abhilfe. Papierdokumente können nach dem Einscannen etwa in durchsuchbare PDFs- konvertiert werden, um eine Stichwortsuche zu ermöglichen. Auch die Extraktion von Daten aus gescannten PDFs oder Fotos und deren Weitergabe an andere Unternehmenssysteme wird durch OCR- und Datenerfassungslösungen ermöglicht – wie es beispielsweise bei der automatisierten, IT-gestützten Verarbeitung von Formularen oder Rechnungen geschieht. Nach dem ‚OCR-Schritt‘ werden Informationen in gescannten Dokumenten zugänglich und somit zu einem wertvollen Unternehmenswert.

Effizient, lückenlos und rechtssicher

Die Integration von OCR- und Dokumentenerfassungstechnologien in DMS-Lösungen hilft beim Wissensmanagement in Unternehmen, indem eingehende Dokumente maschinell lesbar gemacht werden. So haben Unternehmen jederzeit Zugriff auf relevante Informationen und können diese automatisiert in Geschäftsprozesse integrieren. Die so verarbeiteten Dokumente können in Langzeitarchiven in PDF/A-Formaten archiviert werden – die Aufbewahrungspflicht von geschäfts- und fertigungsrelevanten Informationen des Produkthaftungsgesetzes wird dadurch leichter eingehalten. Somit ermöglichen Technologien zur OCR-gestützten Dokumentenumwandlung sowohl die Digitalisierung von Papierarchiven, rechtskonforme Langzeitarchivierung von Dokumenten in PDF/A-Formaten als auch die Einrichtung von effizienz-steigernden Workflows.

Zentrale Verarbeitung

Ein zeitnahes Management von Dokumenten ist gerade bei dezentral organisierten Unternehmen eine Herausforderung. Oft türmen sich Dokumente wochenlang auf Schreibtischen oder sie sind per Hauspost unterwegs. Das verursacht Versandkosten und erhöht das Risiko, wichtige Dokumente zu verlieren. Durch die Nutzung verteilter Informations- und Dokumentenerfassungssysteme können papierbasierte Dokumente über Desktopscanner, Multifunktionsdrucker im Unternehmensnetzwerk oder mit mobilen Endgeräten direkt am ‘Point of Engagement’ digitalisiert und über das Internet an das DMS oder andere Systeme übergeben werden. In diesen Systemen lassen sich die Dokumente verwalten, unabhängig vom Format. Denn in den Betrieben kommen Daten außer in Papierformat und E-Mails zunehmend übers Internet oder in Form von Social Media-Meldungen hinzu. Alle Informationen können standortunabhängig erfasst werden und stehen in Echtzeit zur Verfügung.

Technologien direkt integrieren

Viele produzierende Unternehmen setzen auf branchenspezifische Lösungen. Mit Software Development Kits lassen sich diese Systeme über eine Schnittstelle um viele Funktionalitäten erweitern. So können diese Lösungen maschinengedruckten Text, per Hand eingetragene Informationen, markierte Auswahlfelder oder Informationen in Barcodes aus Dokumenten auslesen und nutzen. Es ist aber auch möglich, gescannte Dokumente als durchsuchbare und bearbeitbare Dateien in digitale Workflows zu integrieren und diese entsprechend ihrem Inhalt automatisch zu klassifizieren. Intelligente Technologien, die selbständig lernen und den Dokumententyp automatisch erkennen und entsprechend bearbeiten, basieren auf komplexen Erkennungsalgorithmen und nutzen den Ansatz von künstlicher Intelligenz (AI).

Nutzung weit über DMS hinaus

Für das produzierende Gewerbe ist von zusätzlichem Nutzen, dass sich die OCR- und Bildumwandlungstechnologien auch in Machine Vision-basierte Systeme integrieren lassen, die für die automatische Qualitätsüberprüfung sowie Produktionsüberwachung genutzt werden. So können zum Beispiel die Bedienpanels und Infotainment-Systeme von Automobilen automatisch überprüft oder die Benutzeroberflächen von Touchpanels und mobilen Endgeräten kontrolliert werden. Dabei werden die auf dem Gerät dargestellten Informationen von einer kamerabasierten Robotik fotografiert, per OCR ausgelesen und mit einem Datenbankeintrag verglichen. Bei der automatischen Produktionssteuerung kann wiederum durch das Abfotografieren und Auslesen von Barcodes der Weg von Bauteilen durch das gesamte Produktionssystem gesteuert, lückenlos überwacht und dokumentiert werden. Auch bei der abschließenden Endkontrolle eines Produkts durch die optischen Inspektionssysteme ist es möglich, die OCR-Funktionalität zu nutzen. Durch die Erweiterung um die Textlesefunktion bei der Qualitätskontrolle von Aufdrucken direkt auf Produkten oder deren Verpackungen, können die vorhandenen Inhalte durch einen Datenbankabgleich automatisch überprüft werden. Die Resultate aller Testdurchläufe und Qualitätskontrollen können dann automatisiert in verwertbare digitale Daten umgewandelt und für die Erstellung von Testberichten und Statistiken verfügbar gemacht werden. Diese Berichte werden wiederum zusammen mit den Bildern im Dokumentenmanagementsystem abgelegt. Die Anwendungsszenarien für Texterkennung in Produktionsbetrieben gehen also weit über den DMS-Bereich hinaus und schließen auch die Produktionsabläufe selbst mit ein.