Anzeige
Anzeige
Anzeige

Störungsmanagement mit künstlicher Intelligenz

AIOps in der Praxis

Beitrag drucken

Von Problemen im Netzwerk bekommen Anwender in Büro und Fabrik am besten erst gar nichts mit. AIOps kann helfen, früh gegen Probleme in den eigenen Anwendungen vorzugehen, schildert Klaus Kurz (Bild), Director Solutions Consulting bei New Relic.

(Bild: New Relic Germany GmbH)

Moderne Anwendungen gehen heute immer besser auf die Bedürfnisse der Nutzer ein. Jedoch kommt die Zuverlässigkeit der Infrastruktur durch häufig eingespielte Updates auch zuweilen an Grenzen. Dies zeigt sich dem Benutzer durch Leistungsprobleme oder im schlimmsten Fall durch den Ausfall des digitalen Services.

Für die Reaktion auf Schwierigkeiten mit der Performanz der Infrastruktur brauchen IT-Teams Tools, um Leistungsprobleme überbrücken zu können. Viele der eher cloudnativen Ansätze sind für Site Reliability Engineers (SREs) allerdings zu undurchsichtig. Gefragt sind mehr Einblicke, die als Grundlage dienen, um Prioritäten richtig setzen sowie ein Problem schnell identifizieren und beheben zu können.

KI-Werkzeug zum Fehler aufspüren

AIOps kann mithilfe von KI und maschinellen Lernen den IT-Spezialisten aufzeigen, wo es Anomalien gibt und deren Ursache identifizieren. So können Probleme aufgedeckt und behoben werden – und sie zu schwerwiegenden Beeinträchtigungen führen. Das wird auch deswegen wichtiger, weil der zu verwaltende Software- und Infrastrukturbestand stetig wächst.

AIOps spielt seine Stärke dort aus, wo große schnell wachsende Mengen an Leistungsdaten – egal ob Observability- und Engagement-Daten oder Daten von anderen Tools – im Spiel sind. Um die Teams bei der Identifizierung und Diagnose eines Problems zu unterstützen, werden Algorithmen und Tools für maschinelles Lernen auf die Daten angewandt. So sollen Prozesse nachvollziehbarer und die Verwaltung von Zwischenfällen automatisierbarer werden. Es gibt mindestens fünf Möglichkeiten, wie AIOps in der Praxis eingesetzt werden kann:

1. Zwischenfälle erkennen

KI und maschinelles Lernen beginnen, Anomalien zu verstehen und wenden dieses Wissen darauf an, Systeme und Infrastrukturen zu monitoren. Dieser Ansatz ermöglicht es, frühe Warnzeichen herauszufiltern und zu prozessieren. Teams werden schneller auf ein Problem aufmerksam, noch bevor ein Anwender etwas merkt.

2. Reduzieren des Alert-Rauschens

Die Flut von Alarmmeldungen ist eine Herausforderung für IT-Teams. Sie führt zu Abstumpfungseffekten, was bei kritischen Alerts fatal sein kann. Es kann sinnvoll sein, Alarmbenachrichtigungen mit niedriger Priorität zu unterdrücken, und solche, die miteinander in Verbindung stehen, zu gruppieren. AIOps korreliert, unterdrückt und priorisiert Vorfälle, damit sich Teams auf die Probleme konzentrieren können, die die Zuverlässigkeit des Systems am meisten gefährden.

3. Der richtige Kontext als Basis

Zwischenfälle versetzen Teams schnell in einen stressigen Krisenmodus. AIOps ist so angelegt, dass in derartigen Fällen das Geschehen automatisch abgebildet wird und so ein ganzheitliches Bild für einen Vorfall liefert. So kann eine Störung nicht nur verstanden, sondern als Reaktion darauf schnell behoben werden.

4. Aus der Vergangenheit lernen

AIOps-Tools lernen stetig dazu, es sind schließlich Machine Learning-Anwendungen. Erfahrungen aus der Vergangenheit, die aktuelle Nutzung und das Feedback von Anwendern liefern Daten, damit ähnliche Probleme kein zweites Mal auftreten. AIOps ist grundsätzlich darauf ausgerichtet, Korrelationen zu erkennen und passende Empfehlungen zur Problembehebung und -vermeidung zu liefern.

5. Integrierte Daten helfen dem Team

Daten zu Zwischenfällen aus angebundenen Quellen können in das Ereignismanagement integriert werden. Eine AIOps-Lösung nimmt diese Daten auf, reichert sie mit Kontext an und sendet Benachrichtigungen an Teams oder Responder in den eingesetzten Incident Management Tools. New Relics Observability-Plattform bietet beispielsweise eine Zweiwege-Integration mit PagerDuty und anderen gängigen Lösungen für das Incident Management an. Je mehr Daten eingehen, desto bessere Handlungsempfehlungen kann AIOps liefern.

Nicht als Block Box gedacht

Die Unterstützung durch KI und maschinelles Lernen stellt bei AIOps nur eine Handlungsempfehlung dar. Es soll für Transparenz im Stack sorgen und Optimierungspotenzial aufzeigen – bei möglichem manuellem Feedback. Die Implementierung von AIOps samt Anomalie-Detection soll mit überschaubarem Aufwand möglich sein, denn basierend auf SRE-Kernsignalen lassen sich Anomalien über Anwendungen, Services und Log-Daten zügig ausmachen.

 


Das könnte Sie auch interessieren:

Die Plattform Industrie 4.0 und das US-amerikanische CESMII - The Smart Manufacturing Institute arbeiten zusammen und wollen gemeinsam die digitale Transformation der Fertigung vorantreiben. Hauptziele sollen die Förderung von Interoperabilität und gemeinsamen Fähigkeiten und Kompetenzen sein.‣ weiterlesen

Knapp die Hälfte der im Rahmen einer von Hewlett Packard Enterprise in Auftrag gegebenen Studie befragten Firmen in Deutschland hat die eigene Cloud-Nutzung seit Beginn der Corona-Krise ausgebaut.‣ weiterlesen

Ohne Digitalisierung und Automation kann kein Fertigungsunternehmen langfristig bestehen, ist Marco Bauer, Geschäftsführer der BAM GmbH, überzeugt. Er setzt daher auf eine digitale automatisierte Prozesskette von Onlineshop bis zu den Fertigungszellen. Zentrales Element ist die automatisierte CAM-Programmierung mit Hypermill.‣ weiterlesen

Google Cloud und Siemens wollen im Rahmen einer Partnerschaft und unter Einsatz von KI-Technologien Fertigungsprozesse verbessern.‣ weiterlesen

Die ZEW-Konjunkturerwartungen für Deutschland sinken in der aktuellen Umfrage vom April 2021 um 5,9 Punkte und liegen damit bei 70,7 Punkten. Dies ist der erste Rückgang seit November 2020. Laut ZEW liegen die Erwartungen nach wie vor auf einem sehr hohen Niveau.‣ weiterlesen

Drei Viertel der Entscheider in deutschen Industrieunternehmen sehen ihren Markt im Prozess der digitalen Transformation. Die Hälfte der Unternehmen setzt dabei bereits auf den Einsatz von Industrial IoT-Technologien. Zu diesen Ergebnissen kommt eines Studie des IIoT-Spezialisten Relayr, die unter 200 Entscheidern aus der Fertigungsindustrie in Deutschland im Sommer 2020 vom Marktforschungsunternehmen Forsa durchgeführt wurde.‣ weiterlesen

Damit die anspruchsvollen Maschinen von Heidelberger Druckmaschinen nicht ungeplant ausfallen, bietet das Unternehmen die Software Maintenance Manager zur vorausschauenden Wartung an. Jetzt hat Tochterunternehmen Docufy das Tool hinter der Lösung als White-Label-Angebot auf den Markt gebracht.‣ weiterlesen

Im Rahmen einer Partnerschaft wollen T-Systems und GFT gemeinsame Lösungen für die Fertigungsindustrie anbieten, mit denen Fehler in der Produktion schneller erkannt werden können.‣ weiterlesen

John Abel wechselt von Veritas zu Extreme Networks, wo er künftig die Position des CIOs wahrnehmen wird.‣ weiterlesen

Nach fünf Messetagen ging am Freitag die Hannover Messe zu Ende. Insgesamt 90.000 Teilnehmer haben sich für die digitale Edition der Industrieschau registriert. Auch ohne Präsenzveranstaltung zog die Deutsche Messe ein positives Fazit. Ein Ersatz sei die digitale Messe jedoch nicht, so Dr. Jochen Köckler, Vorstandsvorsitzender der Deutschen Messe. Die nächste Messe soll als Hybridveranstaltung teilnehmen.‣ weiterlesen

Produzierende Unternehmen brauchen Transparenz über Zusammenhänge, über Kosten und Erträge und die Prozessqualität. Business Intelligence ist die Antwort der Softwareanbieter für dieses Problem. Für SAP S/4Hana-Anwender könnte dafür insbesondere die SAP Analytics Cloud interessant sein.‣ weiterlesen

Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige