17. Mai 2021

Leitfaden für die Machine-Learning-Entwicklung

Künstliche Intelligenz strukturiert projektiert

Wirklich Nutzen aus Machine Learning zu ziehen, ist schon schwer genug. Umso ärgerlicher ist es, wenn Fehler den Fortschritt verzögern. Dieser Leitfaden führt, angelehnt an zahlreiche Best Practices, durch ein erfolgreiches ML-Projekt und zeigt typische Fallstricke auf.

(Bild: Â©putilov_denis/stock.adobe.com) — (Bild: ©putilov_denis/stock.adobe.com)

In der strategischen Planung großer Unternehmen spielen Machine-Learning-Projekte eine immer wichtigere Rolle. Dabei kann die Machine-Learning-Logik selbst zwar oft sehr schnell und kostengünstig entwickelt werden. Doch die Integration die Geschäftsprozesse und die allgemeine Software-Bereitstellung und -Wartung ist eine aufwendige und oft teure Angelegenheit. Drei Faktoren sind wichtig für die erfolgreiche Umsetzung:

• Erstens können traditionelle Softwareentwicklungsparadigmen den Projekterfolg nicht mehr garantieren, sobald große Datenmengen ins Spiel kommen.
• Zweitens ist ein hohes Maß an Koordination und Kooperation nötig, da häufig viele Teams in die Projekte eingebunden sind. Neben Data-Science- und Data-Engineering-Teams sind auch Infrastruktur- und Applikationsentwicklungs-Teams involviert.
• Drittens bauen ML-Entwicklungsprojekte zu Beginn oft nicht direkt auf den Daten auf – sondern auf einmaligen Daten-Exporten. Dies kann dazu führen, dass die Projektteams weder nicht-funktionale noch Skalierungsanforderungen einbeziehen können. Beispiele dafür sind unterschiedliche Datenformate, aber auch die Größe von Datenmengen oder die Geschwindigkeit, mit der Daten bereitgestellt werden, sowie erwartete Antwortzeiten.

Typische Fallstricke

Die folgenden Erkenntnisse zeigen, wie typische Fallstricke vermieden werden können. Wichtig ist zu Projektbeginn das richtige Setup für eine hohe Entwicklungsgeschwindigkeit zu wählen. Darüber hinaus sollte das Ziel – das produktive Deployment – so unkompliziert wie möglich erreicht werden.

KI in Fertigungsbranche vorn

Die neunte Ausgabe von Rockwell Automations „State of Smart Manufacturing“ Report liefert Einblicke in Trends und Herausforderungen für Hersteller. Dazu wurden über 1.500 Fertigungsunternehmen befragt, knapp 100 der befragten Unternehmen kommen aus Deutschland. ‣ weiterlesen

Die Daten

Es ist üblich, lokal gespeicherte Beispieldaten, lokale Skripts und unstrukturierte Entwicklungsumgebungen für die Arbeit mit Daten und die Ergebnisanalyse zu nutzen. Dies sorgt anfangs für mehr Geschwindigkeit, weil die Daten vorhanden und beherrschbar sind. Wenn die Ressourcenanforderungen steigen, stößt das jedoch schnell an Grenzen. Vor allem der Anspruch, die Entwicklungen universal nutzen zu können, leidet darunter. Der stark lokal getriebene Entwicklungsansatz macht es schwer, reproduzierbare Ergebnisse zu liefern, kollaborativ zu arbeiten und Aufgaben wie Parsen, Prozessierung, Training oder Inferenz unabhängig voneinander zu bearbeiten. Das ist beim Deployment in Produktivumgebungen fatal, in denen sich Datenschemata, Speicher- und Prozessierungstechnologien sowie weitere Faktoren ständig ändern. Je früher an das produktive Deployment gedacht wird, desto besser. Best Practices umfassen dabei:

• einen gut strukturierten Code in Verbindung mit Tests, Fehlerbehandlung, Logging und Verwaltung von Abhängigkeiten,
• eine Unterteilung in logische, voneinander unabhängige Abläufe,
• die gleichen Datenquellen, die später in der Produktivumgebung genutzt werden,
• bei der initialen Auswahl der ML-Algorithmen an die späteren Skalierbarkeits-Anforderungen denken.

Langes Training

Das Training von ML-Modellen kann lange dauern. In Verbindung mit großen Datenmengen ist das bei vielen Projekten eine erhebliche technische Herausforderung. Solche Erwägungen sollten bereits in der Experimentierphase einfließen. So lassen sich Skalierbarkeitsprobleme und ein hierdurch verursachter Neuentwicklungsaufwand in späteren Projektphasen verhindern. Eine von vornherein effiziente Trainings-Pipeline liefert zudem einen Produktivitätszuwachs für das Entwicklungsteam und reduziert die Kosten für das Training der Modelle.

Minimum Viable Products

Ein MVP (Minimum Viable Products) ist eine Produktversion, die gerade genug Features aufweist, um bereits zu einem frühen Zeitpunkt von Kunden genutzt werden zu können. MVPs reduzieren die Markteinführungszeit und helfen dabei, früh Nutzerfeedback einzuholen. Letzteres kann damit von Beginn an in die Produktentwicklung einfließen. In der MVP-Entwicklung sollte rechtzeitig mit Produktivanforderungen gearbeitet werden. Das ermöglicht die spätere Erweiterung zu einem Vollprodukt. Sowohl der Code als auch die Infrastruktur sollten dementsprechend gestaltet sein.

Continuous Integration und Continuous Delivery

Continuous Integration/Continuous Delivery (CI/CD) ist eine Methode, die das strukturierte Bereitstellen von Bugfixes und neuen Funktionalitäten ermöglichen soll. Der CI/CD-Prozess sorgt dafür, dass die Arbeit von vielen Teammitgliedern kombiniert wird. Dabei bewahrt er die lokale und globale Integrität des Codes. Continuous Delivery macht Verbesserungen und Erweiterungen der Funktionen schnell für die Nutzer zugänglich. Machine-Learning-Projekte stehen jedoch im Gegensatz zur klassischen Softwareentwicklung, da sie zu Beginn oft durch eine längere lokale Experimentierphase gehen und aufgrund dessen oft sehr skriptlastig sind. CI/CD ist wohl der einzige Ansatz, der die Betriebssicherheit der ML-Lösung im Speziellen und der Applikation im Allgemeinen sicherstellen kann, denn dadurch können sicherheitskritische Updates zu jeder Zeit eingearbeitet werden.

Innovationstreiber Thin[gk]athon: Kollaborative Intelligenz trifft auf Industrie-Expertise

Der Thin[gk]athon, veranstaltet vom Smart Systems Hub, vereint kollaborative Intelligenz und Industrie-Expertise, um in einem dreitägigen Hackathon innovative Lösungsansätze für komplexe Fragestellungen zu generieren. ‣ weiterlesen

Schrittweise produktiv

Die Software in eine Reihe von Pre-Production-Umgebungen auszurollen, hat sich in der Mainstream-Software-Entwicklung als Best Practice durchgesetzt. Im Zuge dessen wird die Software unter algorithmischen, infrastrukturellen und kommerziellen Gesichtspunkten geprüft, bevor eine produktive Bereitstellung erfolgt. Bei ML-Produkten ist das Ziel am Ende oft nicht klar und Entscheidungen über Maßnahmen zur Einrichtung entsprechender Umgebungen werden verzögert. Das frühzeitige Einrichten von DEV (Development)-, QA ( Quality Assurance)- und PROD (Production)-Umgebungen ist grundlegend für die reibungslose Entwicklung eines Machine-Learning-Produkts.

Pipeline-Strukturen anpassen

Das Training von Machine-Learning-Modellen kann selten direkt mit Rohdaten erfolgen. Im Vorfeld muss eine Datenbereinigung und -vorbereitung stattfinden. Das stellt Unternehmen mit großen Datenmengen vor eine komplexe Aufgabe. Damit tatsächlich alle notwendigen Schritte in der richtigen Reihenfolge ausgeführt werden, ist es empfehlenswert, ein Orchestrierungs-Framework wie Kubernetes zu nutzen. Das sorgt für einen Überblick über alle Abläufe.

Machine Learning Operations

Es gibt Anforderungen an Monitoring und Betrieb, die speziell Machine Learning Deployments, so genannte MLOps betreffen. Darunter fallen z.B. das Performance-Monitoring für Machine Learning-Modelle und die Wahl des richtigen Zeitpunkts für sein erneutes Training. Solche Monitoring-Operationen und Entscheidungen erfordern effektive Sammeln, Zusammenführen und Speichern von Metriken zur Beschreibung der Performance von Machine Learning-Algorithmen. Die Wahl der richtigen Frameworks und der Infrastruktur für diese Aufgaben sind wichtige Bausteine der Systemarchitektur.

Daten, Tools und Monitoring

Zumeist entstehen Fehlentwicklungen bereits in der Anfangsphase, wenn es um die Verwendung der richtigen Datenquellen geht. In späteren Phasen können Projekte scheitern, wenn wichtige Anforderungen wie Monitoring und Betrieb nicht frühzeitig in die Architektur einbezogen wurden. Gerade bei Machine Learning-Projekten ist es elementar, mit produktionsähnlichen Daten, einer geeigneten Umgebung und einem Monitoring-Setup zu arbeiten.

Autoren: Sadik Bakiu (Business Unit Manager), Darren Smyth (Senior Consultant) und Patrick Bornikoel (Associate Partner) von Data Reply DE.

News

Bild: Igus GmbH

Industrie 4.0

Igus übernimmt Atronia

Igus hat im März die mehrheitlichen Anteile am portugiesischen Unternehmen Atronia Tailored Sensing erworben. Mit diesem strategischen Schritt will Igus auf dem Markt der vernetzten Kunststoffbauteile weiter expandieren. Ziel ist es, Industrie-4.0-Produkte in Serie herzustellen und auch kleinen mittleren Unternehmen zugänglich zu machen.
Weiterlesen: Igus übernimmt Atronia
Bild: ©kasto/stock.adobe.com

Veranstaltung für die Open Source Community

Open Community Experience feiert Premiere in Mainz

Vom 22. bis 24. Oktober 2024 feiert die OCX in Mainz Premiere und bringt Open Source Communities zusammen. Der Fokus der Veranstaltung liegt auf den Bereichen Automotive und Mobility, Development Tools, Embedded und IoT sowie Cloud Native Java.
Weiterlesen: Open Community Experience feiert Premiere in Mainz
Bild: ©Bussarin/stock.adobe.com

Marktanalyse von Horváth

Stehen humanoide Roboter bald am Fließband?

Humanoide Roboter könnten ab 2025 serienreif sein. Das prognostiziert die Managementberatung Horváth und geht weiter davon aus, dass sich mit diesen Robotern mehr als 50 Prozent der manuellen Tätigkeiten automatisieren lassen.
Weiterlesen: Stehen humanoide Roboter bald am Fließband?
Bild: ©sarayut_sy/stock.adobe.com

Mitglieder-Befragung des VDMA

Mehr Cyberangriffe, weniger Plagiatsfälle

Rund ein Viertel der Maschinen- und Anlagenbauer berichtet von signifikanten Cybersicherheitsvorfällen in den vergangenen zwei Jahren. Plagiatsfälle gingen in diesem Zeitraum hingegen zurück.
Weiterlesen: Mehr Cyberangriffe, weniger Plagiatsfälle
Bild: ©Alexander Limbach/stock.adobe.com

Kritik am Begriff ‚Industrie 5.0‘

Forschungsbeirat und Plattform Industrie 4.0 bleiben bei 4.0

Im Rahmen der Hannover Messe 2024 haben der Forschungsbeirat Industrie 4.0 sowie die Plattform Industrie 4.0 Stellung zum Umgang mit dem Begriff ‚Industrie 5.0‘ genommen.
Weiterlesen: Forschungsbeirat und Plattform Industrie 4.0 bleiben bei 4.0
Bild: PwC PricewaterhouseCoopers AG

Investitionsvorhaben mit KI steigen sprunghaft

Maschinenbau rechnet nicht mit Konjunkturerholung

Besorgt blicken die Entscheidungsträger im Maschinen- und Anlagenbau auf die konjunkturelle Entwicklung in Deutschland.
Weiterlesen: Maschinenbau rechnet nicht mit Konjunkturerholung
Bild: ©Thananit/AdobeStock.com

Open Source Foundations arbeiten zusammen

Sprint zur Cyber Resilience Act-Konformität

Wie erfüllt Open Source Software die Anforderungen des europäischen Cyber Resilience Act? Auf Basis etablierter Prozesse wollen die Apache Software Foundation, die Blender Foundation, die OpenSSL Software Foundation, die PHP Foundation, die Python Software Foundation, die Rust Foundation und die Eclipse Foundation eine gemeinsame Spezifikationen erstellen. Mitarbeit ist ausdrücklich erwünscht.
Weiterlesen: Sprint zur Cyber Resilience Act-Konformität
Bild: ©Gorodenkoff/AdobeStock.com

Expertise des Forschungsbeirats Industrie 4.0

Wie KI und Mensch im Team zusammenarbeiten

In einer neuen Expertise mit dem Titel ‘künstliche Intelligenz und industrielle Arbeit’ des Forschungsbeirats Industrie 4.0 zeigen das Fraunhofer IEM und das Fraunhofer IML Gestaltungsoptionen und Handlungsfelder auf, wie KI in der deutschen Industrie erfolgreich eingesetzt werden kann. Ziel ist sowohl eine Steigerung der Wettbewerbsfähigkeit als auch eine Aufwertung von Arbeitsplätzen.
Weiterlesen: Wie KI und Mensch im Team zusammenarbeiten
Bild: VDMA e.V.

Trendwende ab Herbst erwartet

VDMA: -7% für europäische Bildverarbeitungsindustrie

Basierend auf den neuesten VDMA-Umfragen, verzeichnete die europäische Bildverarbeitungsindustrie 2023 einen Umsatzrückgang von 7%. Die VDMA Fachabteilung Machine Vision rechnet mit einem weiteren Umsatzrückgang von 3% für das laufende Jahr.
Weiterlesen: VDMA: -7% für europäische Bildverarbeitungsindustrie
Bild: BITKOM e.V.

Umfrage im Vorfeld der Hannover Messe

Industrie noch zurückhaltend bei Manufacturing-X

Manufacturing-X ist vielen Unternehmen zwar ein Begriff. Allerdings haben sich bisher die meisten Industrieunternehmen noch nicht näher mit dem Datenökosystem befasst.
Weiterlesen: Industrie noch zurückhaltend bei Manufacturing-X
Bild: VDI Verein Deutscher Ingenieure e.V.

VDI/IW Ingenieurmonitor

159.000 offene Stellen in Ingenieurberufen

Die Zahl der offenen Stellen in Ingenieurberufen bewegt sich im vierten Quartal 2023 weiter auf hohem Niveau. Besonders Berufsfelder mit Klimaschutz- und Digitalisierungsbezug weisen im aktuellen VDI/IW-Ingenieurmonitor eine hohe Engpasskennziffer auf.
Weiterlesen: 159.000 offene Stellen in Ingenieurberufen
Bild: in-tech GmbH

Für Kunden ändert sich nichts

Infosys übernimmt In-tech

In-Tech wird Teil von Infosys. Dies gaben die Unternehmen am Donnerstag bekannt. Der Abschluss der Übernahme wird für das zweite Quartal 2024 erwartet.
Weiterlesen: Infosys übernimmt In-tech
Bild: Ifo-Institut

Materialverfügbarkeit nähert sich dem Vor-Corona-Niveau

Die deutsche Industrie hat kaum noch mit Materialknappheit zu kämpfen. Laut Ifo Institut bewegt sich die Materialverfügbarkeit in Richtung Vor-Corona-Niveau.
Weiterlesen: Materialverfügbarkeit nähert sich dem Vor-Corona-Niveau
Bild: Frauenhofer IGD

Training leicht gemacht

KI mit synthetischen Daten anlernen

Technologien auf Basis künstlicher Intelligenz (KI) benötigen Trainingsdaten. Diese zügig und in ausreichender Stückzahl zu generieren, stellt Anwender in der verarbeitenden Industrie oft vor Herausforderungen. Das Fraunhofer IGD arbeitet daher mit synthetisch erzeugten Trainingsdaten.
Weiterlesen: KI mit synthetischen Daten anlernen
Bild: ©Rymden/stock.adobe.com

Studie von Grammarly und Statista

11,5 Tage Produktionsverlust durch ineffiziente Kommunikation

Ineffiziente Kommunikation im Unternehmen führt laut einer Studie von Grammarly zu einem Produktionsverlust von mehr als 11 Tagen pro Jahr. Die dafür befragten Fachkräfte berichten zudem, dass sie einen große Teil der Wochenarbeitszeit für die Kommunikation über unterschiedliche Plattformen aufwenden.
Weiterlesen: 11,5 Tage Produktionsverlust durch ineffiziente Kommunikation

Reihe Wissen Kompakt

MES Manufacturing Execution Systems

Um alle Potenziale eines MES umfassend ausnutzen zu können, beleuchten unsere Autoren in der Serie von MES Wissen Kompakt die erfolgskritischen Faktoren, um Fertigungsunternehmen präventiv zu steuern. Darüber hinaus präsentiert MES Wissen Kompakt ein breites Spektrum an Firmenportraits, Produkt- neuheiten und Dienst- leistungen im MES-Umfeld.
ERP und CRM

Ein Unternehmen, das sich mit der Auswahl eines ERP- Systems befasst, muss sich gleichsam mit einem viel- schichtigen Software-Markt und unklaren Interessen- lagen an interne Abwick- lungsprozesse auseinander- setzen. Guter Rat bei der Investitionsentscheidung ist teuer. ERP/CRM Wissen Kompakt unterstützt Sie bei der gezielten Investition in die IT-Infrastruktur.
KI Künstliche Intelligenz

Immer mehr Anbieter von Maschinen, Automatisierungstechnik und Industriesoftware integrieren künstliche Intelligenz in ihre Produkte. Das ganze Potenzial spielen selbstlernende Systeme aber erst aus, wenn sie passgenau auf ihren Einsatz in Fertigung und Büro zugeschnitten wurden. Über beide Möglichkeiten, als Fertiger die Vorzüge von industrieller KI zu nutzen, geht es im regelmäßig aktualisierten Themenheft Künstliche Intelligenz.
IIoT Industrial Internet of Things

Das Internet of Things verändert Produktwelten und die Vernetzung in der Fertigung gleichermaßen. Entstehende Ökosysteme laden zur einer neuen Form der Zusammenarbeit ein. Die Spezialausgabe IoT Wissen Kompakt informiert über die Technologie, Projektierung und Anbieter für die eigene Applikation, in- und außerhalb der Fabrik.

Partner-Netzwerke

Microsoft-Partner

Mittelständische Unternehmen investieren selbst in schwierigen Zeiten in Microsoft-Technologien, weil sie überzeugt sind, dass ihre Mitarbeiterproduktivität steigt und sich ihre Kostenstruktur bessert. Microsoft hat mit dem Microsoft-Partner-Network ein Netzwerk aufgebaut, das ein Forum für den Aufbau von Partnerschaften, Zugang zu Ressourcen und einen Rahmen für Dialoge und Kooperationen bietet. Für unsere Leser gibt die Microsoft-Partnerübersicht in Ausgabe Juli/August der IT&Production Tipps für die Suche nach einer geeigneten Branchen- oder Speziallösung im Bereich des produzierenden Gewerbes.
SAP-Partner

Auf der Suche nach Innovation, nach neuen Lösungen und der Abgrenzung zum Mitbewerb vernetzen sich zunehmend mehr Unternehmen mit externen Experten und Partnern. SAP hat mit dem SAP-Ecosystem ein Netzwerk aufgebaut, das ein Forum für den Aufbau von Partnerschaften, Zugang zu Ressourcen und einen Rahmen für Dialoge und Kooperationen bietet. In der Maiausgabe der Fachzeitschrift IT&Production erhalten unsere Leser einen aktuellen Überblick zum SAP-Ecosystem im Bereich des produzierenden Gewerbes.

News

Warum menschenähnliche Chatbots anders beleidigt werden

Virtuelle Assistenten, sogenannte Chatbots, kommen auf vielen Unternehmenswebseiten zum Einsatz.…
Valantic und Forcam Enisco vereinbaren strategische Partnerschaft

Das Beratungs- und Software-Haus Valantic und der Softwarespezialist Forcam Enisco…

das könnte sie auch interessieren

Bild: Palo Alto Networks GmbH / ABI Research

Stand der OT-Sicherheit

Bild: Valantic Supply Chain Excellence GmbH

Transparente Planung erhöht Liefertreue und senkt Bestände

Anzeige

Innovationstreiber Thin[gk]athon: Kollaborative Intelligenz trifft auf Industrie-Expertise

Der Thin[gk]athon, veranstaltet vom Smart Systems Hub, vereint kollaborative Intelligenz und Industrie-Expertise, um in einem dreitägigen Hackathon innovative Lösungsansätze für komplexe Fragestellungen…
Anzeige

KI in Fertigungsbranche vorn

Die neunte Ausgabe von Rockwell Automations „State of Smart Manufacturing“ Report liefert Einblicke in Trends und Herausforderungen für Hersteller. Dazu wurden über…
Blue Prism zeigt Optionen auf

Nachhaltigkeitsthemen im Datenmanagement abbilden

Technologien wie Robotic Process Automation (RPA) oder künstliche Intelligenz (KI) können Unternehmen beim Management von ESG-Daten unterstützen. Der Softwarespezialist Blue Prism beleuchtet…
Deutsch-chinesische Handelsbeziehungen

Weniger deutsche Unternehmen abhängig von Vorprodukten aus China

Im Vergleich zu einer Untersuchung kurz vor Beginn Kriegs in der Ukraine, geben in einer aktuellen Untersuchung des Ifo Instituts weniger Unternehmen…
Trendthemen der Prozessindustrie

Achema 2024 mit Angeboten für Nachwuchskräfte

Im Mittelpunkt des Achema-Auftakts am 10. Juni steht die Frage, wie sich die Prozessindustrie in einer Welt im Wandel erfolgreich positionieren kann.…

Leitfaden für die Machine-Learning-Entwicklung

Künstliche Intelligenz strukturiert projektiert

Typische Fallstricke

KI in Fertigungsbranche vorn

Die Daten

Langes Training

Minimum Viable Products

Continuous Integration und Continuous Delivery

Innovationstreiber Thin[gk]athon: Kollaborative Intelligenz trifft auf Industrie-Expertise

Schrittweise produktiv

Pipeline-Strukturen anpassen

Machine Learning Operations

Daten, Tools und Monitoring

News

Anbieter & Produkte

Whitepaper

Videos

Reihe Wissen Kompakt

Partner-Netzwerke

News

das könnte sie auch interessieren