Anzeige
Anzeige
Anzeige
Anzeige
Beitrag drucken

Offline-Spracherkennung für die Werkhalle

Sprechen statt tippen

Sprachsteuerung kann bei der Bedienung einer Maschine oder eines Computers nützlich sein, wenn beispielsweise keine Hand frei ist. Dabei ist zwischen Online- und Offline-Geräten zu unterscheiden. Letztere bieten den Vorteil, dass sie auch ohne Netzabdeckung funktionieren.

(Bild: ©lassedesignen/stock.adobe.com)

(Bild: ©lassedesignen/stock.adobe.com)

Die Spracheingabe ist nicht neu. Einen Zulauf erlebte die Technologie zuletzt mit der Markteinführung von Sprachassistenten wie Alexa von Amazon oder Siri von Apple. Pkw-Navigationssysteme können per Spracheingabe Adressen und Namen entgegen nehmen und per Sprachausgabe Meldungen zur Navigation oder Verkehrsstörungen ausgeben. Der Dialog ist dabei oft stark formalisiert, Schlüsselworte müssen an einer bestimmten Position im Satzbau auftauchen, um erkannt und korrekt zugeordnet zu werden. Spracheingabe ist dann sinnvoll, wenn der Anwender damit nicht überfordert wird. Das bedeutet, dass er entweder über weitere Möglichkeiten der Eingabe verfügt, oder die Eingabesyntax so einfach ist, dass kein Lernaufwand erforderlich ist. In Verbindung mit bekannten Bedienmodalitäten kann das SUI (Speech User Interface) mit dem GUI (Graphisches User Interface) kombiniert werden und stellt eine sinnvolle Ergänzung zum Display mit Touchscreen, Tastatur und Maus dar.

Online oder offline?

Grundsätzlich unterscheidet man zwischen Online- und Offline-Sprachsteuerung. Online-Geräte können beispielsweise mit Unterhaltungselektronik vernetzt werden und diese steuern. Sprachsteuerungen, die ein abgeschlossenes System darstellen, können offline eingesetzt werden. Das bietet beispielsweise Vorteile bei geringer Netzabdeckung. Auch für die Industrie wird die Spracheingabe interessant, ermöglicht sie doch weitergehende Bedienvarianten und erhöhte Flexibilität. Durch die lange Lebensdauer einer Maschine und des erhöhten Sicherheitsbedarfs in der Fertigung stellen Anwender jedoch zusätzliche Anforderungen. Sie müssen über einen langen Zeitraum verfügbar und gegebenenfalls erweiterbar sein, das Aktivierungswort (Wake Word) muss frei wählbar sein und es sollten unterschiedliche Sprachen verfügbar sein.

Erkennung auf dem Prozessor

Der Audio-Spezialist Voice Inter Connect hat eine Lösung entwickelt, die ohne Internetanbindung betrieben werden kann – die Erkennung findet lokal auf dem Systemprozessor statt. Dadurch kann die Lösung in Bereichen eingesetzt werden, in denen Daten vertraulich gehalten werden müssen. Die Spracheingabe muss zudem keiner festen Syntax folgen und kann völlig frei gesprochen werden. Das Erkennungsergebnis wird mittels KI-basierter Auswerteverfahren semantisch verarbeitet, damit die gewünschte Funktionsklasse (Intent), die eingegebenen Parameter (Slot) und die dazugehörigen Werte (Value) automisch erkannt und zur Gerätesteuerung bereitgestellt werden können. Weitere Anforderungen sind eine hohe Zuverlässigkeit der Spracherkennung sowie die einfache Integration. Die Kommandos sollten in einer natürlichen Sprache mit freier Wahl des Satzbaus eingegeben werden können, für die Maschine nichtrelevante Füllworte automatisch ignoriert werden. Durch die verschiedene Landessprachen können einerseits Begriffe exakt definiert und den Landesgewohnheiten angepasst und andererseits ungewünschte Begriffe ignoriert werden. Im Servicefall ist ein schneller Zugriff auf den Zustand der Spracheingabe erwünscht, um den Grund für eine Fehlfunktion festzustellen. Für den professionellen Einsatz ist die Langzeitverfügbarkeit essentiell, denn die lokale Sprachsteuerung unterliegt nicht dem Geschäftsmodell eines Cloud-Anbieters, der sein Kostenmodell ändert oder den Dienst abschaltet.

Offline-Sprachsteuerung in der Applikation (Bild: Hy-Line Computer Components Vertriebs GmbH)

Offline-Sprachsteuerung in der Applikation (Bild: Hy-Line Computer Components Vertriebs GmbH)


Das könnte Sie auch interessieren:

Im Anlagenbau ist das Zusammenspiel von Engineering und Fertigung alles andere als trivial. Es gilt, fertigungsrelevante Daten projektbezogen in die jeweiligen Prozesse an Maschinen zu übermitteln, oft mit erheblichem Aufwand und manchen Schnittstellenhürden. Helfen kann das RiPanel Processing Center von Rittal, ein neues Jobmanagement-Tool zur zentralen Arbeitsvorbereitung.‣ weiterlesen

Im Forschungsprojekt ’Fluently’ wollen die Beteiligten das Teamwork von Mensch und Maschine optimieren. So sollen zwischen beiden echte soziale Interaktionen ermöglicht werden.‣ weiterlesen

Selbst gut ausgeprägte ERP-Systemlandschaften weisen meist Lücken auf, in denen Prozesse ohne digitales Abbild ablaufen. Individuell erstellte mobile Anwendungen können solche Lücken schließen - und so manch andere Schwachstelle in der ERP-Landschaft ausbügeln.‣ weiterlesen

Waren Cloudkosten verschwendet oder sinnvoll? Wer Ausgaben keinen Verursachern zuordnet, kann dies kaum hinlänglich beantworten. Erst die interne Verrechnung legt die Ursachen für die Ausgaben offen - und somit das Potenzial für Optimierungen.‣ weiterlesen

Zum Jahresende verzeichnet der Maschinen- und Anlagenbau einen rückläufigen Auftragseingang. Preisbereinigt vermeldet der VDMA ein Minus von 4 Prozent im Vergleich zum Jahr 2021. Im vierten Quartal gingen die Aufträge um 16 Prozent zurück.‣ weiterlesen

Zehn Unternehmen beteiligen sich am Joint Venture Cofinity-X. Die Partner wollen damit die Umsetzung von Datenökosystems Catena-X weiter vorantreiben.‣ weiterlesen

Mit einem Plus von 1,9 Punkten verzeichnet das Geschäftsklima der Digitalbranche im Januar einen erneuten Anstieg und liegt nun bei 18,5 Punkten. Erstmals seit Sommer 2022 liegen zudem die Geschäftserwartungen im positiven Bereich.‣ weiterlesen

Ob zur Remote-Unterstützung der Mitarbeiter vor Ort, zur Schulung und technischen Einweisung neuen Personals oder bei der Umplanung von Produktionsstraßen - fotorealistische digitale Zwillinge können Unternehmen vielfältig unterstützen.‣ weiterlesen

Viele ERP-Lösungen wurden einst von Spezialisten entwickelt und danach nur noch angepasst, erweitert und mit Updates versorgt. Doch steigende Digitalisierungsanforderungen, schnellere Produkteinführungen sowie der Fachkräftemangel schrauben die Anforderungen in die Höhe. Könnte Low-Code-Softwareentwicklung die Lösung sein?‣ weiterlesen

Mit einem Anstieg von 1,6 Punkten im Januar liegt das IAB-Arbeitsmarktbarometer bei 102,9 Punkten und damit über der neutralen Marke von 100. Für die Arbeitsmarktforscher deutet dies auf positive Entwicklungen auf dem Arbeitsmarkt hin.‣ weiterlesen