27. Februar 2019

Fachliteratur per Algorithmus auswerten

Wissensaufbau mit Text-Mining

Viele produzierende Unternehmen investieren längst in Fertigungstechnik, die sich der Vision von cyber-physischen Systemen nähert. Doch das gibt es noch lange nicht von der Stange, sondern muss zum Teil auf Basis aktueller Forschungen adaptiert werden. Diese zeitaufwendige Arbeit wiederum können Text-Mining-Analysen unterstützen. Der Analytics-Spezialist Mayato hat sich mit solchen Modellen kürzlich einen Überblick zum Thema ‚Sensordatenanwendungen in der industriellen Fertigung‘ verschafft – und gibt Einblicke, wie sich Literaturreviews so deutlich beschleunigen lassen.

Abb. 1: Aufbau des Analysemodells für die automatisierte Literatursynthese (Bild: Mayato GmbH)

Unstrukturierte Daten aus natürlichsprachlichen Texten machen einen erheblichen Teil der in Unternehmen gespeicherten Informationen aus. Intern archiviert werden beispielsweise Korrespondenzen, Verträge, Berichte oder Studien mit Geschäftsrelevanz. Darüber hinaus sind unzählige Webseiten und Services extern über das Internet abrufbar, welche wertvolle branchenrelevante Informationen in Nachrichten, Produktreviews oder Pressemitteilungen enthalten können. Für die Analyse unstrukturierter Texte mit dem Ziel, Wissen effizient und effektiv aus einem vorliegenden Korpus abzuleiten, bietet Text Mining einige etablierte Methoden an. Mit statistischen Verfahren oder künstlicher Intelligenz wird den Texten dabei eine semantische Struktur verliehen, anhand welcher das Korpus durchsucht, zusammengefasst und beschrieben werden kann. Dadurch wird das Wissen aus den Texten schnell und einfach zugänglich gemacht und kann zudem breiter aufgenommen werden. Und genau darum ging es im vorliegenden Projekt: Anwendungsfälle und Herausforderungen der digitalen Fertigung mit Bezug zu Sensordatenanwendungen zu überblicken und den Experten bei Mayato einen unkomplizierten Zugang zu den in der Forschungsliteratur angebotenen Lösungskonzepten, Architekturen und Verfahren zu verschaffen. Dazu sammelte das Team Forschungsarbeiten aus Journalen wie dem Journal of Manufacturing Systems, dem Journal of Intelligent Manufacturing und dem Journal of Manufacturing Science and Engineering. Anhand eines zuvor entwickelten Analysemodells sollten die unterschiedlichen Quellen strukturiert und synthetisiert werden. Abbildung 1 stellt auf einem abstrakten Detaillevel den grundlegenden Aufbau des Analysemodells dar.

Abb. 2: Häufigste Wörter und Phrasen im analysierten Korpus (Bild: Mayato GmbH)

Analyseergebnisse

Noch bevor durch das Clustering der Literatursammlung automatisiert eine Struktur verliehen wird, gibt schon die Betrachtung der häufigsten Wörter Aufschlüsse über die wichtigen Themen, Methoden und Begriffe im Korpus. Neben alleinstehenden Wörtern können auch Phrasen aus mehreren Wörtern mit Hilfe künstlicher Intelligenz automatisch identifiziert und daraufhin gezählt werden. Diese Phrasen sind häufig besonders aussagekräftig. Abbildung 2 zeigt die häufigsten Wörter und Phrasen des in dem Anwendungsbeispiel analysierten Korpus. So lässt sich beispielsweise sofort erkennen, dass der Begriff der Echtzeit in diesem Korpus eine sehr wichtige Rolle spielt, oder dass neuronale Netze sehr häufig diskutiert werden. Auf Basis der häufigsten Worte und Phrasen kann ein erster Begriffskatalog für das Forschungsprojekt angelegt werden.

KI in Fertigungsbranche vorn

Die neunte Ausgabe von Rockwell Automations „State of Smart Manufacturing“ Report liefert Einblicke in Trends und Herausforderungen für Hersteller. Dazu wurden über 1.500 Fertigungsunternehmen befragt, knapp 100 der befragten Unternehmen kommen aus Deutschland. ‣ weiterlesen

Abb. 3: Visualisierte Wortwolken (Bild: Mayato GmbH)

Wortwolken visualisieren Zusammenhänge

Weiterhin können vorab bereits die Themen aus einem Topic Model untersucht und bezeichnet werden. Für die Visualisierung bieten sich hier Wortwolken an, wie Abbildung 3 für einige Beispielthemen zeigt. Die Größe der Wörter gibt dabei jeweils deren Wichtigkeit für das jeweilige Thema an. So finden sich unter den Beispielthemen etwa die Themen ‚Messung der Werkzeugabnutzung beim Fräsen mit Vibrationssignalen‘ oder ‚Fehlererkennung in der Montage mit Videodaten‘. Experten können diese Themen mit Hilfe der Visualisierung sehr schnell einordnen und als ein in dem untersuchten Korpus vorhandenes Konzept mit Bezug zu den gegebenen Begriffen identifizieren.

Abb. 4: Beispiele aus dem Gesamtdendrogramm beschriftet mit Forschungstiteln (Bild: Mayato GmbH)

Algorithmen übernehmen Synthese

Die Aufgabe des Analysemodelles für die automatisierte Synthese der Literatur ist im ersten Schritt, die in hochdimensionale Vektorrepräsentationen transformatierten Forschungsarbeiten hierarchisch zu clustern. Abbildung 4 zeigt das für das Anwendungsbeispiel aus dem Clustering resultierende Dendrogramm und macht für einige Beispiel-Cluster dessen Teil-Dendrogramm lesbar. Die vertikalen Linien in der Dendrogrammdarstellung zeigen, bei welchem Distanzschwellwert zwei Cluster in eines zusammengeführt wurden, während die horizontalen Linien Aufschluss über die Distanz zwischen den beiden Clustern geben. Für die Bildung der Cluster wird ein Distanzschwellwert gesetzt (vertikale gestrichelte Linie), welcher heuristisch oder empirisch bestimmt werden kann. Beispielsweise das erste oben gezeigte Cluster enthält Arbeiten, welche sich mit der Modellierung und Kompensation thermischer Fehler an Werkzeugmaschinen befassen, während das zweite Beispiel sich ausschließlich mit drahtlosen Sensornetzwerken befasst. Das Dendrogramm kann ebenfalls mit den als Kapitelüberschriften extrahierten Schlüsselwörtern beschriftet werden, wie Abbildung 5 zeigt. Jede Zeile entspricht hier den wichtigsten Schlüsselwörtern für das jeweilige Cluster. So sieht man beispielsweise in der zweiten Zeile, dass für das erste Beispiel oben sehr treffend die Schlüsselwörter ‚Real Time Compensation, CNC Machining Center, Thermal Error, Error Compensation‘ extrahiert wurden. Die Schlüsselwörter sind insgesamt sehr aussagekräftig: Wie das Beispiel zeigt, ist das Analysemodell dazu fähig, kohärente Literaturcluster zu bilden, wie sie ein Mensch unter hohem zeitlichem und kognitivem Aufwand auch bilden könnte. Das Dendrogramm liest sich dabei von oben nach unten wie das Inhaltsverzeichnis eines Buches. Die extrahierten Schlüsselwörter geben – wie Kapitelüberschriften – Aufschluss über die enthaltenen Themen. Es lassen sich leicht thematische Überschneidungen in nebeneinanderliegenden Clustern erkennen. Die Kapitelstruktur eines Literaturreviews kann sich so sehr eng an der Clusterbildung orientieren. Anhand der hierarchischen Struktur des Dendrogramms können die Cluster in Unterkapitel unterteilt werden oder auch in Überkapitel zusammengefasst. Für die weitere Arbeit mit den Forschungsarbeiten können die PDF-Versionen anhand der gefundenen Cluster in eine Ordnerstruktur abgelegt und strukturiert zugänglich gemacht werden. Die für das Literaturreview des Beispiels von Mayato gebildeten Hauptkapitel zeigt Abbildung 6 mit Referenz zu den Clustern im Dendrogramm. Insgesamt bieten die Ergebnisse des Analysemodells eine erhebliche Erleichterung, wenn es darum geht, hunderte oder tausende Forschungsarbeiten zu strukturieren und synthetisieren. Erschöpfende Literaturreviews können hiervon besonders profitieren, da sehr schnell ein strukturierter Überblick über das betrachtete Feld ermöglicht wird. Die Anfertigung des Literaturreviews und das Herauskristallisieren der wissenschaftlichen Erkenntnisse – unterstützt durch die Analyseergebnisse – bleibt schließlich kreative Aufgabe der Forscher.

MEGLA Headquarter ab 2024 im
Lensing Media Port Dortmund

MES-Integrator und 360-Grad-Partner für optimierte Fertigung

Das Manufacturing Execution System (MES) HYDRA optimiert Produktionsprozesse für Fertigungsunternehmen, um Wettbewerbsvorteile zu erzielen. ‣ weiterlesen

Abb. 5: Gesamt-Dendrogramm beschriftet mit extrahierten Schlüsselwörtern (Bild: Mayato GmbH)

Fundament für den Wissensaufbau

Literaturreviews sind ein unverzichtbarer Bestandteil von Forschungsprojekten und sie spielen eine wichtige Rolle für den Wissensaufbau in forschenden Unternehmen. Das vorgestellte Analysemodell kann Wissensarbeitern kognitiven Aufwand abnehmen, der sonst in die Analyse, Strukturierung und Synthese von Literatur fließen würde. Es erleichtert Forschern den Umgang mit großen Mengen an Literatur und kann einen wichtigen Beitrag zur Steigerung der Produktivität in der Review-Phase von Projekten leisten. Den Aufbau und die Organisation von Wissen im Unternehmen kann das Analysemodell damit unterstützen und beschleunigen.

Abb. 6: Gesamt-Dendrogramm mit den Kapitelüberschriften des Literaturreviews (Bild: Mayato GmbH)

Ansatz vielfältig übertragbar

Die Anwendungsfälle des Analysemodells sind jedoch nicht alleine auf die Literatursynthese in Forschungsprojekten beschränkt. Überall dort, wo große Mengen unstrukturierter Textdaten vorliegen, die es zu analysieren und zu verstehen gilt, kann das Analysemodell als Werkzeug eingesetzt werden. Bei den analysierten Texten kann es sich sowohl um unternehmensexterne Daten aus dem Web handeln, wie etwa um Foreneinträge oder Tweets über die Produkte des Unternehmens, die es im Interesse der Marketingabteilung zu analysieren gilt, als auch um unternehmensinterne Daten, wie Wartungsberichte für die Maschinen aus der Produktion, deren Analyse den Ingenieuren Verbesserungspotentiale in den Wartungsroutinen für weniger Maschinenstillstände aufzeigen können. Es ist außerdem denkbar, Suchmaschinen für unternehmensinterne Textdaten zu entwickeln, um für gegebene Queries die relevantesten Texte aus dem Unternehmen zurückliefern zu können.

Autoren: Daniel Krause ist Experte für Datenanalyse bei der mayato GmbH

News

Bild: ©Thananit/AdobeStock.com

Open Source Foundations arbeiten zusammen

Sprint zur Cyber Resilience Act-Konformität

Wie erfüllt Open Source Software die Anforderungen des europäischen Cyber Resilience Act? Auf Basis etablierter Prozesse wollen die Apache Software Foundation, die Blender Foundation, die OpenSSL Software Foundation, die PHP Foundation, die Python Software Foundation, die Rust Foundation und die Eclipse Foundation eine gemeinsame Spezifikationen erstellen. Mitarbeit ist ausdrücklich erwünscht.
Weiterlesen: Sprint zur Cyber Resilience Act-Konformität
Bild: ©Gorodenkoff/AdobeStock.com

Expertise des Forschungsbeirats Industrie 4.0

Wie KI und Mensch im Team zusammenarbeiten

In einer neuen Expertise mit dem Titel ‘künstliche Intelligenz und industrielle Arbeit’ des Forschungsbeirats Industrie 4.0 zeigen das Fraunhofer IEM und das Fraunhofer IML Gestaltungsoptionen und Handlungsfelder auf, wie KI in der deutschen Industrie erfolgreich eingesetzt werden kann. Ziel ist sowohl eine Steigerung der Wettbewerbsfähigkeit als auch eine Aufwertung von Arbeitsplätzen.
Weiterlesen: Wie KI und Mensch im Team zusammenarbeiten
Bild: VDMA e.V.

Trendwende ab Herbst erwartet

VDMA: -7% für europäische Bildverarbeitungsindustrie

Basierend auf den neuesten VDMA-Umfragen, verzeichnete die europäische Bildverarbeitungsindustrie 2023 einen Umsatzrückgang von 7%. Die VDMA Fachabteilung Machine Vision rechnet mit einem weiteren Umsatzrückgang von 3% für das laufende Jahr.
Weiterlesen: VDMA: -7% für europäische Bildverarbeitungsindustrie
Bild: BITKOM e.V.

Umfrage im Vorfeld der Hannover Messe

Industrie noch zurückhaltend bei Manufacturing-X

Manufacturing-X ist vielen Unternehmen zwar ein Begriff. Allerdings haben sich bisher die meisten Industrieunternehmen noch nicht näher mit dem Datenökosystem befasst.
Weiterlesen: Industrie noch zurückhaltend bei Manufacturing-X
Bild: VDI Verein Deutscher Ingenieure e.V.

VDI/IW Ingenieurmonitor

159.000 offene Stellen in Ingenieurberufen

Die Zahl der offenen Stellen in Ingenieurberufen bewegt sich im vierten Quartal 2023 weiter auf hohem Niveau. Besonders Berufsfelder mit Klimaschutz- und Digitalisierungsbezug weisen im aktuellen VDI/IW-Ingenieurmonitor eine hohe Engpasskennziffer auf.
Weiterlesen: 159.000 offene Stellen in Ingenieurberufen
Bild: in-tech GmbH

Für Kunden ändert sich nichts

Infosys übernimmt In-tech

In-Tech wird Teil von Infosys. Dies gaben die Unternehmen am Donnerstag bekannt. Der Abschluss der Übernahme wird für das zweite Quartal 2024 erwartet.
Weiterlesen: Infosys übernimmt In-tech
Bild: Ifo-Institut

Materialverfügbarkeit nähert sich dem Vor-Corona-Niveau

Die deutsche Industrie hat kaum noch mit Materialknappheit zu kämpfen. Laut Ifo Institut bewegt sich die Materialverfügbarkeit in Richtung Vor-Corona-Niveau.
Weiterlesen: Materialverfügbarkeit nähert sich dem Vor-Corona-Niveau
Bild: Frauenhofer IGD

Training leicht gemacht

KI mit synthetischen Daten anlernen

Technologien auf Basis künstlicher Intelligenz (KI) benötigen Trainingsdaten. Diese zügig und in ausreichender Stückzahl zu generieren, stellt Anwender in der verarbeitenden Industrie oft vor Herausforderungen. Das Fraunhofer IGD arbeitet daher mit synthetisch erzeugten Trainingsdaten.
Weiterlesen: KI mit synthetischen Daten anlernen
Bild: ©Rymden/stock.adobe.com

Studie von Grammarly und Statista

11,5 Tage Produktionsverlust durch ineffiziente Kommunikation

Ineffiziente Kommunikation im Unternehmen führt laut einer Studie von Grammarly zu einem Produktionsverlust von mehr als 11 Tagen pro Jahr. Die dafür befragten Fachkräfte berichten zudem, dass sie einen große Teil der Wochenarbeitszeit für die Kommunikation über unterschiedliche Plattformen aufwenden.
Weiterlesen: 11,5 Tage Produktionsverlust durch ineffiziente Kommunikation
Bild: ©Karl J. Donath

Untersuchung der TU Dresden

Warum menschenähnliche Chatbots anders beleidigt werden

Virtuelle Assistenten, sogenannte Chatbots, kommen auf vielen Unternehmenswebseiten zum Einsatz. Eine Studie der TU Dresden hat untersucht, ob Fehler von Chatbots zu aggressivem Verhalten bei ihren Nutzerinnen und Nutzern führen und welchen Einfluss die vermeintliche Menschlichkeit der virtuellen Assistenten auf die Reaktionen hat.
Weiterlesen: Warum menschenähnliche Chatbots anders beleidigt werden
Vernetzung und Datenanalyse

Valantic und Forcam Enisco vereinbaren strategische Partnerschaft

Das Beratungs- und Software-Haus Valantic und der Softwarespezialist Forcam Enisco mit Sitz in Böblingen haben eine strategische Partnerschaft geschlossen. Schwerpunkt der Kooperation soll auf Vernetzungs- und Analyse-Produkten für Fertiger liegen.
Weiterlesen: Valantic und Forcam Enisco vereinbaren strategische Partnerschaft
Bild: ©Markus Diesner/MPDV Mikrolab GmbH

Symbolischer Spatenstich

Baustart für neues MPDV-Gebäude in Mosbach

Am Unternehmenssitz in Mosbach errichtet MPDV ein neues Bürogebäude. Auf 2.800m² sollen 170 Arbeitsplätze entstehen. Zudem wird die MPDV-Junior-Akademie dort Räumlichkeiten beziehen.
Weiterlesen: Baustart für neues MPDV-Gebäude in Mosbach
Bild: ©️Summit Art Creations/stock.adobe.com

Blue Prism zeigt Optionen auf

Nachhaltigkeitsthemen im Datenmanagement abbilden

Technologien wie Robotic Process Automation (RPA) oder künstliche Intelligenz (KI) können Unternehmen beim Management von ESG-Daten unterstützen. Der Softwarespezialist Blue Prism beleuchtet die Möglichkeiten.
Weiterlesen: Nachhaltigkeitsthemen im Datenmanagement abbilden
Bild: ©metamorworks/istockphoto.com

Mehr Präzision für Robotersysteme

BlackBerry und AMD kooperieren

Im Rahmen einer Kooperation haben sich BlackBerry und AMD zum Ziel gesetzt, Präzision und Steuerung von Robotersystemen zu verbessern.
Weiterlesen: BlackBerry und AMD kooperieren
Bild: Gaia-X Hub Deutschland

Neue Arbeitsgruppe am Gaia-X Hub

Gaia-X Hub: neue Arbeitsgruppe für vernetzte Lieferketten

Am Gaia-X Hub wurde eine neue Branchenarbeitsgruppe ins Leben gerufen, die sich mit digital vernetzten Lieferketten beschäftigt.
Weiterlesen: Gaia-X Hub: neue Arbeitsgruppe für vernetzte Lieferketten

Reihe Wissen Kompakt

MES Manufacturing Execution Systems

Um alle Potenziale eines MES umfassend ausnutzen zu können, beleuchten unsere Autoren in der Serie von MES Wissen Kompakt die erfolgskritischen Faktoren, um Fertigungsunternehmen präventiv zu steuern. Darüber hinaus präsentiert MES Wissen Kompakt ein breites Spektrum an Firmenportraits, Produkt- neuheiten und Dienst- leistungen im MES-Umfeld.
ERP und CRM

Ein Unternehmen, das sich mit der Auswahl eines ERP- Systems befasst, muss sich gleichsam mit einem viel- schichtigen Software-Markt und unklaren Interessen- lagen an interne Abwick- lungsprozesse auseinander- setzen. Guter Rat bei der Investitionsentscheidung ist teuer. ERP/CRM Wissen Kompakt unterstützt Sie bei der gezielten Investition in die IT-Infrastruktur.
KI Künstliche Intelligenz

Immer mehr Anbieter von Maschinen, Automatisierungstechnik und Industriesoftware integrieren künstliche Intelligenz in ihre Produkte. Das ganze Potenzial spielen selbstlernende Systeme aber erst aus, wenn sie passgenau auf ihren Einsatz in Fertigung und Büro zugeschnitten wurden. Über beide Möglichkeiten, als Fertiger die Vorzüge von industrieller KI zu nutzen, geht es im regelmäßig aktualisierten Themenheft Künstliche Intelligenz.
IIoT Industrial Internet of Things

Das Internet of Things verändert Produktwelten und die Vernetzung in der Fertigung gleichermaßen. Entstehende Ökosysteme laden zur einer neuen Form der Zusammenarbeit ein. Die Spezialausgabe IoT Wissen Kompakt informiert über die Technologie, Projektierung und Anbieter für die eigene Applikation, in- und außerhalb der Fabrik.

Partner-Netzwerke

Microsoft-Partner

Mittelständische Unternehmen investieren selbst in schwierigen Zeiten in Microsoft-Technologien, weil sie überzeugt sind, dass ihre Mitarbeiterproduktivität steigt und sich ihre Kostenstruktur bessert. Microsoft hat mit dem Microsoft-Partner-Network ein Netzwerk aufgebaut, das ein Forum für den Aufbau von Partnerschaften, Zugang zu Ressourcen und einen Rahmen für Dialoge und Kooperationen bietet. Für unsere Leser gibt die Microsoft-Partnerübersicht in Ausgabe Juli/August der IT&Production Tipps für die Suche nach einer geeigneten Branchen- oder Speziallösung im Bereich des produzierenden Gewerbes.
SAP-Partner

Auf der Suche nach Innovation, nach neuen Lösungen und der Abgrenzung zum Mitbewerb vernetzen sich zunehmend mehr Unternehmen mit externen Experten und Partnern. SAP hat mit dem SAP-Ecosystem ein Netzwerk aufgebaut, das ein Forum für den Aufbau von Partnerschaften, Zugang zu Ressourcen und einen Rahmen für Dialoge und Kooperationen bietet. In der Maiausgabe der Fachzeitschrift IT&Production erhalten unsere Leser einen aktuellen Überblick zum SAP-Ecosystem im Bereich des produzierenden Gewerbes.

News

MVTec eröffnet Niederlassung in Taiwan

Bereits seit 2020 unterhält MVTec ein Vertriebsbüro in Taiwan. Dieses…
Lohnt sich ein Retrofit?

Oft ist unklar, ob es sich lohnt, ältere Maschinen mit…

das könnte sie auch interessieren

Bild: Valantic Supply Chain Excellence GmbH

Transparente Planung erhöht Liefertreue und senkt Bestände

Bild: Dechema Ausstellungs-GmbH

Achema 2024 mit Angeboten für Nachwuchskräfte

Anzeige

Innovationstreiber Thin[gk]athon: Kollaborative Intelligenz trifft auf Industrie-Expertise

Der Thin[gk]athon, veranstaltet vom Smart Systems Hub, vereint kollaborative Intelligenz und Industrie-Expertise, um in einem dreitägigen Hackathon innovative Lösungsansätze für komplexe Fragestellungen…
Channel-Organisation und Marketing künftig enger verzahnt

Neue Vice President Channel & Marketing bei Schneider Electric DACH

Mit der Zusammenlegung von Marketing und Channel-Organisation stellt Schneider Electric die Kommunikationsarbeit in der DACH-Region neu auf.
Webkonferenz für mittelständische Unternehmen

Digital Future Congress nimmt Techniktrends in den Blick

Der zweitägige virtuelle Digital Future Congress stellt im April die Potenziale aktueller Technologietrends in den Mittelpunkt. Per Video-Chat können sich die Teilnehmer…
Forschungsprojekt am Fraunhofer IAF

Ein Stück näher am Quanteninternet

Das Quanteninternet verspricht signifikante Verbesserungen in verschiedenen technologischen Schlüsselbereichen. Um dieses jedoch im bestehenden Glaserfasernetz zu realisieren, sind Quantenfrequenzkonverter nötig, die die…
Anzeige

KI in Fertigungsbranche vorn

Die neunte Ausgabe von Rockwell Automations „State of Smart Manufacturing“ Report liefert Einblicke in Trends und Herausforderungen für Hersteller. Dazu wurden über…

Fachliteratur per Algorithmus auswerten

Wissensaufbau mit Text-Mining

Analyseergebnisse

KI in Fertigungsbranche vorn

Wortwolken visualisieren Zusammenhänge

Algorithmen übernehmen Synthese

MES-Integrator und 360-Grad-Partner für optimierte Fertigung

Fundament für den Wissensaufbau

Ansatz vielfältig übertragbar

News

Anbieter & Produkte

Whitepaper

Videos

Reihe Wissen Kompakt

Partner-Netzwerke

News

das könnte sie auch interessieren