Anzeige
Beitrag drucken

Offline-Spracherkennung für die Werkhalle

Sprechen statt tippen

Sprachsteuerung kann bei der Bedienung einer Maschine oder eines Computers nützlich sein, wenn beispielsweise keine Hand frei ist. Dabei ist zwischen Online- und Offline-Geräten zu unterscheiden. Letztere bieten den Vorteil, dass sie auch ohne Netzabdeckung funktionieren.

(Bild: ©lassedesignen/stock.adobe.com)

(Bild: ©lassedesignen/stock.adobe.com)

Die Spracheingabe ist nicht neu. Einen Zulauf erlebte die Technologie zuletzt mit der Markteinführung von Sprachassistenten wie Alexa von Amazon oder Siri von Apple. Pkw-Navigationssysteme können per Spracheingabe Adressen und Namen entgegen nehmen und per Sprachausgabe Meldungen zur Navigation oder Verkehrsstörungen ausgeben. Der Dialog ist dabei oft stark formalisiert, Schlüsselworte müssen an einer bestimmten Position im Satzbau auftauchen, um erkannt und korrekt zugeordnet zu werden. Spracheingabe ist dann sinnvoll, wenn der Anwender damit nicht überfordert wird. Das bedeutet, dass er entweder über weitere Möglichkeiten der Eingabe verfügt, oder die Eingabesyntax so einfach ist, dass kein Lernaufwand erforderlich ist. In Verbindung mit bekannten Bedienmodalitäten kann das SUI (Speech User Interface) mit dem GUI (Graphisches User Interface) kombiniert werden und stellt eine sinnvolle Ergänzung zum Display mit Touchscreen, Tastatur und Maus dar.

Online oder offline?

Grundsätzlich unterscheidet man zwischen Online- und Offline-Sprachsteuerung. Online-Geräte können beispielsweise mit Unterhaltungselektronik vernetzt werden und diese steuern. Sprachsteuerungen, die ein abgeschlossenes System darstellen, können offline eingesetzt werden. Das bietet beispielsweise Vorteile bei geringer Netzabdeckung. Auch für die Industrie wird die Spracheingabe interessant, ermöglicht sie doch weitergehende Bedienvarianten und erhöhte Flexibilität. Durch die lange Lebensdauer einer Maschine und des erhöhten Sicherheitsbedarfs in der Fertigung stellen Anwender jedoch zusätzliche Anforderungen. Sie müssen über einen langen Zeitraum verfügbar und gegebenenfalls erweiterbar sein, das Aktivierungswort (Wake Word) muss frei wählbar sein und es sollten unterschiedliche Sprachen verfügbar sein.

Erkennung auf dem Prozessor

Der Audio-Spezialist Voice Inter Connect hat eine Lösung entwickelt, die ohne Internetanbindung betrieben werden kann – die Erkennung findet lokal auf dem Systemprozessor statt. Dadurch kann die Lösung in Bereichen eingesetzt werden, in denen Daten vertraulich gehalten werden müssen. Die Spracheingabe muss zudem keiner festen Syntax folgen und kann völlig frei gesprochen werden. Das Erkennungsergebnis wird mittels KI-basierter Auswerteverfahren semantisch verarbeitet, damit die gewünschte Funktionsklasse (Intent), die eingegebenen Parameter (Slot) und die dazugehörigen Werte (Value) automisch erkannt und zur Gerätesteuerung bereitgestellt werden können. Weitere Anforderungen sind eine hohe Zuverlässigkeit der Spracherkennung sowie die einfache Integration. Die Kommandos sollten in einer natürlichen Sprache mit freier Wahl des Satzbaus eingegeben werden können, für die Maschine nichtrelevante Füllworte automatisch ignoriert werden. Durch die verschiedene Landessprachen können einerseits Begriffe exakt definiert und den Landesgewohnheiten angepasst und andererseits ungewünschte Begriffe ignoriert werden. Im Servicefall ist ein schneller Zugriff auf den Zustand der Spracheingabe erwünscht, um den Grund für eine Fehlfunktion festzustellen. Für den professionellen Einsatz ist die Langzeitverfügbarkeit essentiell, denn die lokale Sprachsteuerung unterliegt nicht dem Geschäftsmodell eines Cloud-Anbieters, der sein Kostenmodell ändert oder den Dienst abschaltet.

Offline-Sprachsteuerung in der Applikation (Bild: Hy-Line Computer Components Vertriebs GmbH)

Offline-Sprachsteuerung in der Applikation (Bild: Hy-Line Computer Components Vertriebs GmbH)


Das könnte Sie auch interessieren:

Wenn Unternehmen mehr als einen Prozess mit künstlicher Intelligenz optimieren wollen, können Data-Science-Plattformen Geschwindigkeitsvorteile bieten. Diese Lösungen bieten in der Regel verschiedene Komponenten, um Daten aufzubereiten und darzustellen.‣ weiterlesen

Immer komplexere, spezialisiertere Hardware übernimmt Aufgaben im Fertigungsprozess. Doch dieser Hardware-First-Ansatz bringt auch Tücken mit sich. Dabei ist die Lösung ganz einfach: bessere Software und simplere Maschinen‣ weiterlesen

Die Begriffe Generative Design und Topologieoptimierung werden oft verwechselt. Worin aber liegen die genauen Unterschiede zwischen den beiden CAD-Tools? Dieser Frage und dem daraus entstehenden Potenzial widmet sich der folgende Beitrag.‣ weiterlesen

PTC hat den Schüler-Wettbewerb ‘Robots to the Rescue‘ ausgeschrieben. Die Aufgabe ist es einen Roboter zu entwerfen, der bei der Lösung eines realen Problems helfen kann. Die Teilnahme erfolgt virtuell.‣ weiterlesen

Der Einfluss von künstlicher Intelligenz (KI) auf IT-Lösungen in der Fertigung lässt sich kaum leugnen. Von Predictive Quality bis hin zu Automated Data Science ist das Potenzial von KI-Anwendungen bereits jetzt groß - gerade auch in Verbindung mit historischen Daten aus dem Manufacturing Execution System.‣ weiterlesen

Zehntausende Stellen für IT-Fachkräfte waren in Deutschland im letzten Jahr unbesetzt. Ein neues Test-Verfahren hilft Unternehmen dabei, unter Quereinsteigern diejenigen zu finden, die offene IT-Stellen ohne Abschluss - aber mit Erfahrungswissen - ausfüllen können.‣ weiterlesen

Der Ifo-Index der Produktionserwartungen erlebte im März den stärksten Rückgang seit Beginn der Erhebung im Jahr 1991. Dabei zeigt sich die Automobilindustrie besonders pessimistisch.‣ weiterlesen

Im Februar verfehlten die Auftragseingänge im deutschen Maschinenbau ihr Vorjahresniveau real um 4 Prozent. Während die Bestellungen der inländischen Kunden um 6 Prozent sanken, lagen die Auslandsorders um 3 Prozent unter ihrem Vorjahresniveau. „Das ist die Ruhe vor dem Sturm“, sagt VDMA-Chefvolkswirt Dr. Ralph Wiechers.‣ weiterlesen

Um autonome Systeme mit KI einschätzen zu können, müssen sie unabhängig von der Domäne verglichen werden. Teil 5 unserer Serie 'Autonome Systeme' greift den Nutzen einer Gegenüberstellung auf und was es dazu braucht. Katharina Giese und Piet Lipke vom Fraunhofer IOSB-INA erläutern das am Beispiel autonomer Anlagenkomponenten in der Forschungsfabrik SmartFactoryOWL in Lemgo.‣ weiterlesen

Sergio Resendiz (Bild) ist neuer Leuze-Vice President Americas und berichtet direkt an den CEO Ulrich Balbach.‣ weiterlesen

Eine zentrale Anwendung beim Roboter-Einsatz ist die Kollaboration zwischen Mensch und Maschine – beispielsweise die Unterstützung bei für den Menschen belastenden Aufgaben. Welche Vorteile eine produktive Mensch-Roboter-Kooperation (MRK) haben kann, zeigt das Fraunhofer-Institut für Nachrichtentechnik, Heinrich-Hertz-Institut, HHI bei der Überprüfung von Schweißnähten in der Automobilindustrie‣ weiterlesen

Anzeige
Anzeige
Anzeige