Spracherkennung und Semantik im Lager

Kommissionieren leicht gemacht

Sprachtechnologie kommt heute in immer mehr deutschen Lagerhäusern und Distributionszentren zum Einsatz. Die zunehmende Akzeptanz verwundert nicht, schließlich bietet die Technik zahlreiche Vorteile. Dazu zählen Fehlerfreiheitsraten bis zu 99,9 Prozent, Produktivitätszuwächse von 15 bis 35 Prozent und halbierte Einarbeitungszeiten. Bei der erfolgreichen Einführung hilft Grundlagenwissen zur Technik.

Bild: Vocollect

Sprache ist die effizienteste Möglichkeit, Mitarbeiter im Lager durch ihre Aufgaben zu führen und die Arbeitsqualität laufend zu kontrollieren. Denn wer mit einem tragbaren, voice-tauglichen Computer und einem Headset arbeitet, muss im Wesentlichen nur zuhören und antworten. Kein Display, kein Scanner, keine Tastatur und keine Papierliste lenken die Arbeitskräfte ab. Hände, Blicke und auch der Kopf bleiben frei für die Kernaufgaben. Die Sprachdaten lassen sich direkt ins Lager-Managementsystem übertragen, was wiederum dem Unternehmen einen besseren Überblick und frühzeitige Reaktionen auf kritische Situationen gestattet. Inzwischen wird Sprachtechnologie neben der Kommissionierung auch für Lagerpozesse wie Einlagerung und Nachschub, interner Transport, Cross-Docking, Warenein- und Ausgang, Qualitätskontrolle und Inventur verwendet. Das ‚Voice-centric Warehouse‘, bei dem Sprache die Basistechnologie darstellt, die durch Geräte wie Scanner und RFID-Reader nur noch bei Bedarf ergänzt wird, ist bei manchen Anwendern bereits Realität.

Spracherkennung als entscheidender Faktor

Der wohl wichtigste Erfolgsfaktor für im industriellen Umfeld genutzten Sprachtechnologielösungen ist die Qualität der Spracherkennung. Dabei finden im Wesentlichen zwei Verfahren Verwendung: Die so genannte ’sprecherunabhängige‘ sowie die ’sprecherabhängige‘ Methode. Sprecherunabhängige Verfahren kommen auch in Telefonanlagen, Navigationsgeräten und Diktiersystemen zum Einsatz. Ihr Vorteil ist, dass sie festgelegte Ausdrücke unabhängig davon erkennen, wer sie ausspricht. Damit sprecherunabhängige Systeme Gesagtes korrekt zuordnen, muss ein großer Pool an Aussprachevarianten hinterlegt sein. Moderne Lösungen sind hier schon recht weit. Dennoch kommt es bei dem Verfahren immer wieder zu Fehlern: Etwa aufgrund von Dialekten, Akzenten oder Sprachfehlern werden Begriffe mitunter nicht oder falsch erkannt.

Die Folge sind Verzögerungen oder Fehler in gerade den Prozessen, die durch Voice-Technologie optimiert werden sollen. Eine nahezu perfekte Spracherkennungsqualität lässt sich erst mit sprecherabhängigen Systemen erreichen. Im Gegensatz zu sprecherunabhängigen Lösungen werden bei dieser Methode von jedem Benutzer Sprachprofile für alle von ihm später benötigten Begriffe erstellt. Dazu muss er die Wörter und Zahlen einige Male in der von ihm gewohnten Weise aussprechen. Die Software wertet das Gesagte aus, speichert die Ergebnisse und stellt die Profile umgehend bereit, wenn der Mitarbeiter seine Schicht beginnt. Durch die Berücksichtigung individueller Sprachmerkmale werden Äußerungen während der Arbeitsabläufe schneller und zuverlässig als bei der sprecherunabhängigen Erfassung erkannt.

Das gilt auch, wenn sie sehr rasch am Stück oder mit längeren Pausen zwischen den einzelnen Wörtern duchgegeben werden. Zudem können Mitarbeiter Wörter aus anderen Sprachen verwenden, um mit dem System zu kommunizieren. Das erleichtert die Zusammenarbeit mit Personen aus anderen Sprachkreisen erheblich. Den Vorteilen sprecherabhängiger Erkennung steht allerdings zusätzlicher Zeitaufwand für das Anlegen der individuellen Sprachprofile entgegen. Bei einem Wortschatz von meist weniger als 50 Begriffen, der für typische Lager- und Industrieanwendungen benötigt wird, ist der komplette Vorgabe allerdings meist innerhalb von 15 Minuten abgeschlossen. Zudem wird der Mitarbeiter direkt am Gerät geschult.