Business-IT
01.11.2019
Artificial Intelligence for IT Operations (AIOps)
1. Teil: „KI und IT-Operations bilden ein starkes Team“

KI und IT-Operations bilden ein starkes Team

Mensch und MaschineMensch und MaschineMensch und Maschine
Bild: Shutterstock / studiostoks
Ohne KI und Big Data ist das Management komplexer IT-Infrastrukturen kaum noch zu leisten. Deshalb kommen vermehrt Automatisierungen zum Einsatz
  • Unübersichtlichkeit: Fünf Faktoren steigern die Komplexität von IT-Infrastrukturen, allen voran Anzahl und Typ der Endgeräte.
    Quelle:
    Enterprise Strategy Grou, 2019 (n = 400)
Manch ein IT- und Data-Center-Fachmann mag sich die Zeiten zurückwünschen, in denen die IT-Welt noch überschaubar war. Das Herz bildeten Großrechner, auf die Thin Clients oder Terminals zugriffen. Hinzu kamen Anwendungen, die über das hausinterne Netzwerk bereitgestellt wurden und die meist keine allzu hohen Anforderungen etwa an die Performance der IT-Infrastruktur stellten. Heute sieht sich die IT-Abteilung immer komplexeren IT-Umgebungen gegenüber. Dazu tragen viele Faktoren bei: Cloud-Services werden parallel zu traditionellen IT-Diensten genutzt,  Anzahl und Vielfalt der Endgeräte steigen, Multi-Cloud-Umgebungen werden zur Normalität, Firmen greifen auf Ansätze wie Software-defined Networking, Hyperkonvergenz und Software-defined Wide Area Networks (SD-WANs) zurück.
Laut einer Umfrage des Beratungshauses Enterprise Stra­tegy Group (ESG) sind für 31 Prozent der IT-Fachleute vor allem die Endgeräte dafür verantwortlich, dass Netzwerke und IT-Umgebungen immer aufwendiger zu verwalten sind. Fast gleichauf folgen anwachsende Datenmengen (30 Prozent), verursacht etwa durch IoT-Systeme, sowie die zunehmende Anzahl von Anwendungen (29 Prozent). Nicht zu unterschätzen sind zudem die Effekte der Digitalisierung (26 Prozent), die sich in steigenden Anforderungen an die IT niederschlagen.
Im „Market Guide for AIOps Platform“ führt das Beratungsunternehmen Gartner zwei weitere Faktoren an, die herkömmliche Tools für Monitoring, Application Performance Management und Network Operations an Grenzen stoßen lassen: die große Zahl unterschiedlicher Datentypen, die Maschinen und Menschen erzeugen, etwa Log-Daten, Metriken und Dokumente, sowie die immer höhere Geschwindigkeit, mit der Daten erzeugt werden.

Überfordertes Monitoring

Die Konsequenz dieser Entwicklung: „Da geschäftskritische Anwendungen immer verfügbar sein müssen, ist es notwendig, Probleme mit der Infrastruktur quasi in Echtzeit zu lösen, damit sie sich nicht negativ auf das Unternehmen und seine Kunden auswirken“, erklärt Bob Laliperte, Practice Director & Senior Analyst bei ESG. Das erfordert jedoch einen anderen Ansatz als den gebräuchlichen.
„Entscheidend ist heute, Fehler möglichst so schnell zu entdecken und zu beheben, dass der Anwender von ihnen überhaupt keine Notiz nimmt und es zu keinem negativen Einfluss auf das Geschäft kommt“, bestätigt Karsten Flott, CER Sales Engineer Manager bei AppDynamics, einem Unternehmensbereich von Cisco. „Diese Geschwindigkeit lässt sich nicht erreichen, wenn Log-Files von Hand durchsucht werden. Das Ziel muss sein, Fehler nicht reaktiv zu beseitigen, sondern sie proaktiv zu verhindern.“
Doch die Realität sieht anders aus. Heute kommen in einem Rechenzentrum typischerweise Dutzende von Monitoring- und Managementwerkzeugen zum Einsatz. Oft anzutreffen ist ein Zoo von Lösungen für Network Performance Monitoring (NPM) und Application Performance Management (APM). Hinzu kommen Tools zum Überwachen spezieller Infrastruktur-Komponenten wie virtualisierten Umgebungen, Software-defined Networks und Wide Area Networks.
Einen Ausweg erhoffen sich Anwender von „Artificial Intelligence for IT Operations“, kurz AIOps. Die Integration von KI und maschinellem Lernen in den Betrieb von IT-Infrastrukturen soll reaktive Muster durch einen proaktiven Ansatz ersetzen. Das Beratungshaus Gartner definiert AIOps-Plattformen als Software-Systeme, die Big Data mit KI- und Machine-Learning-Funktionen kombinieren, um einen Großteil der IT-Operations-Prozesse zu erweitern oder zu ersetzen.
Zu diesen Prozessen und Aufgaben zählen die Überwachung der Verfügbarkeit und Performance von IT-Systemen und Anwendungen sowie das Korrelieren und die Analyse von Vorkommnissen („Events“). Auch das IT-Servicemanagement (ITSM) und das Automatisieren von Aufgaben im Bereich IT Operations Management (ITOM) fallen darunter.
2. Teil: „AIOps-Elemente“

AIOps-Elemente

  • ITOM: Laut Gartner ermöglichen AIOps-Plattformen ein lückenloses „IT Operations Management“.
    Quelle:
    Gartner
Eine AIOps-Lösung umfasst mehrere zentrale Prozesse. Der erste ist das Sammeln von Daten aus unterschiedlichen Quellen, und dies unabhängig von IT und Netzwerk-Domains. Diese Informationen bereitet das AIOps-System auf und konsolidiert sie. „Technologisch ist die Datenbasis von entscheidender Bedeutung, weniger, dass diese Daten aus unterschiedlichen Quellen kommen“, betont Peter Jürß, Principal IT Architect - Platform Solutions bei Axians IT Solutions, einem weltweit aktiven Dienstleister im Bereich IT und Kommunikationstechnik. „Wenn die Daten unvollständig oder fehlerhaft sind, spielt es keine Rolle, ob ich eine Quelle oder hundert verwende, denn das Ergebnis wird immer fehlerhaft sein.“
Wichtig ist daher laut Jürß, dass Data Scientists und Operations-Mitarbeiter eng zusammenarbeiten, um die Qualität der Daten sicherzustellen. „Es geht nur gemeinsam, denn nur ein Data Scientist kann beurteilen, ob das neuronale Netz einer AIOps-Lösung richtig funktioniert, und nur ein Operations-Mitarbeiter kann beurteilen, ob die Empfehlung des Systems Sinn ergibt.“
Auf einen weiteren Aspekt weist Karsten Flott von AppDynamics hin: „Entscheidend ist, dass alle Informationen an einem Punkt zusammenlaufen. Nur so entsteht eine zentrale Übersicht über sämtliche Assets. Außerdem ist eine hohe Detailtiefe des Monitorings wichtig - bis hinunter auf die einzelne Codezeile.“ Viele Unternehmen scheitern Flott zufolge an dieser Herausforderung, weil sie nicht eine übergreifende Lösung im Einsatz haben, sondern in jedem Fachbereich ein separates Tool einsetzen. „Solche Insellösungen machen die Implementierung von AIOps praktisch unmöglich, da es keine einheitliche und ausreichend detailreiche Datenbasis gibt.“
Im zweiten Schritt der AIOps-Prozesse folgt die Analyse der Daten, die Anwendungen, IT-Systeme und Netzwerkkomponenten bereitstellen. Eine AIOps-Lösung sollte dabei die Daten in einen Kontext einordnen. Sie ermittelt beispielsweise, welche Fehler im Programmcode einer Lösung welche Nutzergruppen tangieren und welche negativen Effekte für deren Produktivität und die Geschäftstätigkeit dadurch entstehen.
Nutzerbezogene Datenmodelle und Analysemethoden, die den IT-Anwender und seine User Experience in den Mittelpunkt stellen, haben laut Riverbed, einem Anbieter von AIOps-Lösungen, einen weiteren Vorteil: Sie geben Aufschluss über eine komplette Transaktion, beispielsweise im Bereich E-Commerce. Ein Online-Anbieter kann nicht nur ermitteln, wie es um die Performance des Shop-Systems aus Sicht des Kunden bestellt ist. Er erhält zudem Informationen darüber, welche Waren der Kunde in seinen virtuellen Einkaufskorb packt und wie oft er den Shop besucht. Diese Daten sind hilfreich, um die Angebotspalette des Shops zu optimieren und um Stammkunden zu identifizieren.
Zu den wichtigsten Kernkomponenten von AIOps-Lösungen zählt eine Machine-Learning-Funktion. Sie erstellt auf Basis der Datenanalysen Handlungsoptionen, die sich automatisch umsetzen lassen. Ein Beispiel ist die Reaktion auf Anomalien wie eine Überlast­situation im Rechenzentrum: „Bei Lastspitzen ist es möglich, automatisch zusätzliche Instanzen bei einem Cloud-Service-Provider hinzuzubuchen und sie anschließend wieder abzustoßen“, berichtet Karsten Flott.
Künstliche Intelligenz und Machine Learning können zudem das IT-Sicherheitsniveau verbessern. „Wenn das Monitoring einen Fehler in einer Komponente entdeckt oder feststellt, dass gegen Compliance-Anforderungen verstoßen wird, gibt die KI-Instanz einer AIOps-Lösung Hilfestellung bei der Suche nach einer Antwort und kann, falls gewollt, automatisch Korrekturmaßnahmen in die Wege leiten“, erläutert Axians-Fachmann Peter Jürß.
Eine Befragung von Nutzern durch den amerikanischen AIOps-Spezialisten OpsRamp ergab, dass mehr als vier Fünftel der IT-Abteilungen (85 Prozent) AIOps dazu verwenden, um Routineaufgaben zu automatisieren. Dadurch, so die Nutzer, haben IT-Experten mehr Zeit, sich um anspruchsvollere Aufgaben zu kümmern. Fast ebenso viele Firmen (80 Prozent) benutzen die Technologie, um die Zahl der Alarme („Alerts“) zu reduzieren und die Ursachen solcher Meldungen zu ermitteln. Zu diesem Zweck setzt die AIOps-Software Alarmmeldungen unterschiedlicher Systeme miteinander in Beziehung und filtert Alerts aus, die mehrfach ausgelöst wurden. Eine solche Root-Cause-Analyse durch KI- und Machine-Learning-Algorithmen zählt zu den Haupteinsatzfeldern von AIOps-Lösungen.
Quasi ein Nebeneffekt ist, dass die Zahl der „Incidents“ (gemeldete Vorfälle) und der entsprechenden Incident Tickets sinkt. Ein Großteil dieser Incidents wird bislang manuell überprüft. Diese Handarbeit entfällt oder lässt sich auf wenige Vorgänge reduzieren. „Dadurch dass AIOps zahlreiche Datenquellen anzapft und korreliert, findet sie auch in komplexen Umgebungen, in denen Administratoren gar nicht alles im Blick haben können, Zusammenhänge und Problem­lösungen“, sagt Peter Jürß von Axians IT Solutions.
Checkliste AIOps-Auswahl
Bevor Unternehmen eine AIOps-Anwendung implementieren, ist es ratsam, diverse Dinge zu klären, so Lakeside Software, Anbieter von IT- und Anwendungsanalyse-Tools.
Zunächst gilt es zu prüfen, wie es um das hausinterne Know-how und um die vorhandenen Tools im Bereich Monitoring bestellt ist.
Fragen an die eigenen IT-Fachleute
  • Sind bereits Lösungen für Application Performance Management (APM), Network Performance Monitoring and Diagnostics (NPMD) sowie Digital Experience Monitoring (DEM) und IT Infra­structure Monitoring (ITIM) im Einsatz?
  • Sind Data Scientists beziehungsweise IT-Fachleute vorhanden, die eine AIOps-Lösung implementieren, anpassen und betreiben können?
  • Wurde geklärt, in welchen Bereichen AIOps zum Einsatz kommen soll (Use Cases) und welchen Nutzen sich das Unternehmen davon verspricht? Dies schließt auch eine Erfolgskontrolle mit ein, sprich eine Überprüfung, ob sich der angestrebte Nutzen eingestellt hat.
Fragen an den AIOps-Anbieter
  • Anschließend sollten die in Betracht kommenden AIOps-Lösungen analysiert werden. Hier sind vor allem folgende Aspekte von Interesse:
  • Handelt es sich um eine eigenständige AIOps-Lösung oder „nur“ um eine Monitoring-Plattform, die um AIOps-Funktionen erweitert wurde?
  • Mit welchen Arten von Daten lässt sich das AIOps-Tool füttern (Data Ingestion)?
  • Entsprechen die Breite und die Tiefe der Daten den Anforderungen des Anwenders?
  • Ist die Lösung in der Lage, hohe Datenvolumina von Quellen zu verarbeiten, die in unterschiedlichen IT-Domains vorhanden sind?
  • Welche Datenarten werden unterstützt, etwa Events, Metriken, Log-Informationen, Konfigurationseinstellungen, Key Performance Indicators (KPIs)?
  • Können vorhandene Monitoring-Tools eingebunden werden?
  • Ist die AIOps-Lösung auch für komplexe Umgebungen ausgelegt, etwa Hybrid- und Multi-Cloud-Infrastrukturen?
  • Erfolgt die Abrechnung der Nutzung auf Basis der Datenmengen, die dem AIOps-Tool zugeführt werden? Stehen in diesem Fall Funktionen bereit, mit denen sich unnötige Kosten vermeiden lassen, die etwa durch mehrfache Verarbeitung derselben Daten entstehen?
  • Welche Machine-Learning-Funktionen stellt die Software bereit? Welche Algorithmen verwendet sie und wie lassen sich diese an individuelle Anforderungen anpassen?
  • Welche weiteren Analysefunktionen sind verfügbar?
  • Welches Know-how ist nötig, um die Machine-Learning- und Analyse-Tools nutzbringend einzusetzen?
  • Sind die Analyse- und Visualisierungsfunktionen so ausgelegt, dass sie die Anforderungen der Mitarbeiter in der IT-Operations-Abteilung und im Service Desk erfüllen?
  • Für welche Anwendungsfälle ist die Plattform ausgelegt? Decken sich diese mit den Use Cases, die für den Anwender relevant sind?
  • Ist eine Cloud- und eine On-Premise-Version verfügbar? Dies ist vor allem für Unternehmen wichtig, die wegen Compliance-Regeln sensible Daten nicht in einem Public-Cloud-Rechenzentrum speichern und verarbeiten dürfen.
3. Teil: „AIOps-Vorteile“

AIOps-Vorteile

Aus den Aussagen der Experten lassen sich als Hauptvorteile einer AIOps-Plattform acht Aspekte ableiten:
  • Vermeiden von kostspieligen Ausfallzeiten, höhere Nutzerzufriedenheit: Vorhersagen von Ausfallursachen dienen dazu, Probleme proaktiv zu beheben und die Effizienz von IT-Operations zu erhöhen.
  • Kürzere Bereitstellungszeiten: Die Mean Time to Resolve (MTTR) verkürzt sich nach Angaben des Beratungshauses Enterprise Management Associates um bis zu 65 Prozent. IT-Services lassen sich um 70 Prozent schneller bereitstellen.
  • Auflösen von IT-Silos und isolierten Reaktionen: In Silos eingeschlossene Daten werden genutzt, um Ausfallzeiten durch eine beschleunigte Ursachenanalyse zu reduzieren. Es entsteht außerdem kein „Herrschaftswissen“ bei einzelnen IT-Operations-Fachleuten oder in bestimmten Abteilungen.
  • Reduzierung des „Datenlärms“: IT-Ops-Teams können Ereignisse korrelieren, um den Kontext von Meldungen zu verbessern und aus der Vielzahl von Informationen Insights zu gewinnen.
  • Eliminieren manueller Aufgaben: Automatisierung reduziert Inkonsistenzen bei Reaktionen, beseitigt Fehler, die sich sonst nur schwer beheben lassen, und schont Ressourcen. Die IT-Abteilung konzentriert sich auf die Analyse und Optimierung von Prozessen oder übernimmt höherwertigere Aufgaben.
  • Kürzere Reaktionszeiten bei der Problembehebung. Voraussetzung ist laut Axians die „Qualität der AIOps-Lösung“.
  • Höheres Sicherheitsniveau: Anomalien rechtzeitig zu erfassen, verbessert die Sicherheit von IT-Systemen und Netzwerken. Angriffe werden schneller erkannt.
  • Ansatz für das Business Process Mininig: Dabei werden die Datenquellen von IT-Operations und Applikationen im Rahmen von AIOps miteinander kombiniert.

Datenwirrwarr reduzieren

Ganz entscheidend kommt es darauf an, dass AIOps die Vielzahl der Daten reduziert. „Intelligente AIOps-Lösungen korrelieren, aggregieren und priorisieren Incident-Daten, reduzieren dadurch den Datenlärm und verkürzen die Mean Time To Resolution deutlich“, stellt Guy Fighel fest, General Manager of AIOps und Vice President Product Engineering beim amerikanischen Monitoring- und AIOps-Spezialisten New Relic. Anstatt den AIOps-Ansatz auf einen bestimmten Aspekt des Incident-Response-Prozesses zu beschränken, empfiehlt New Relic, die Verbindungen zwischen den einzelnen Phasen des Implementierungsprozesses zu verstärken, um eine leistungsfähigere Lösung zu schaffen. „Es reicht nicht aus, sich nur auf schnelleres Erkennen, Verstehen, Reagieren oder Nachbereiten zu konzentrieren“, so Fighel. „Teams brauchen ein Werkzeug, das wie ihre besten Site Reliability Engineers denkt - aus einer Systemperspektive heraus.“ Zuverlässige AIOps-Funktionen könnten Ereignisse korrelieren, um den Kontext der Systemmeldungen zu verbessern. Gerade für vielbeschäftigte Teams, die unter dem Druck stehen, die MTTR zu verkürzen, kann eine ständig wachsende Liste von Tools Probleme bereiten: Vorfall-, Ereignis- und Telemetriedaten sind fragmentiert, isoliert oder redundant. „Dies macht es schwieriger, die für die Diagnose und Behebung von Vorfällen erforderlichen Informationen zu finden“, berichtet Guy Fighel.
AIOps-Plattformen versprechen, diese Probleme mit einem zentralen, intelligenten Feed von Incident-Informationen zu lösen, der alles anzeigt, was IT-Experten zur Fehlerbehebung und Reaktion auf Probleme benötigen, und zwar auf einem Blick.

Implementierung

Allerdings warnt Guy Fighel davor, die Implementierung von AIOps auf die leichte Schulter zu nehmen: „Diesen Mehrwert zu erschließen kann einen erheblichen Zeitaufwand und eine Anpassung des Workflows erfordern und die Teams etliche Stunden an Integrations-, Konfigurations-, Schulungs- und Onboarding-Arbeiten kosten“, gibt er zu bedenken. Aus diesem Grund habe New Relic AIOps „ganz oben“ auf seiner Observability-Plattform implementiert. „Daher kann unsere Lösung Daten aus mehr als 60 Integrationen aufnehmen. Damit erhalten Kunden sofort wertvolle Daten.“
Einen weiteren Aspekt bringt Karsten Flott von AppDynamics ins Spiel: „Wir stellen fest, dass Anwender zunehmend von Anbietern verunsichert werden, die auf den ‚KI-/Maschinelles-Lernen-Zug‘ aufspringen, aber in Wirklichkeit noch keine verlässliche Lösung anbieten.“ Das schreckt potenzielle Nutzer ab. „Wer jedoch erprobte Lösungen mit einem Mehrwert anzubieten hat und auf konkrete Anwendungsfälle verweisen kann, dem schlägt auf dem Markt derzeit viel Interesse entgegen“, so Flott. Hilfreich ist es daher, sich vom Anbieter der AIOps-Lösung Referenzkunden nennen zu lassen und zu diesen Kontakt aufzunehmen.
Tabelle:

4. Teil: „Cloud oder On-Premise“

Cloud oder On-Premise

  • AIOps-Plattform: So sieht das Cloud-Management-Haus BMC den Aufbau einer AIOps-Lösung.
    Quelle:
    BMC Software
Was die Bereitstellung von AIOps-Lösungen betrifft, haben die Unternehmen bei AIOps die Wahl zwischen Cloud-Ser­vices und der Installation im Unternehmensrechenzentrum, so Stéphane Estevez von der Datenplattform Splunk: „AIOps kann als On-Premise-Lösung, in der Cloud oder gemischt genutzt werden.“ Wie bei jedem Outsourcing hänge die Entscheidung für ein Modell von Faktoren wie Kosten, Skalierbarkeit und Wartung ab. „Cloud ist offensichtlich ein Trend, aber viele Branchen wie der öffentliche Dienst können aufgrund von gesetzlichen Vorgaben und Compliance-Regelungen nur AIOps als On-Pre­mise-Lösung verwenden“, erläutert Estevez.
Die Beratungshäuser Gartner und ESG warnen davor, Probleme wie Skalierbarkeit und die Komplexität von Technologien wie KI zu unterschätzen. Unternehmenseigene IT-Abteilungen könnten schnell davon überfordert werden, eine AIOps-Lösung am Laufen zu halten und die Algorithmen anzupassen. „Wir empfehlen wegen der einfacheren Nutzung und des geringeren Wartungsaufwands den meisten Nutzern das SaaS-Modell“, so Karsten Flott von AppDynamics.
Diese Einschätzung deckt sich mit Ergebnissen einer Befragung von IT-Managern mit Budget-Verantwortung durch das deutsche Beratungs- und Marktforschungshaus Research in Action. Demzufolge ist für rund 9 Prozent der Unternehmen, die in AIOps-Lösungen investieren, vor allem ein nutzungsbezogenes Abrechnungsmodell wichtig. An die 8 Prozent wünschen sich die Möglichkeit, eine Cloud-Plattform zu nutzen - im Rahmen eines Software-as-a-Service-Modells.
Damit haben wirtschaftliche Faktoren einen vergleichbaren Stellenwert wie technische Aspekte. Denn laut Research in Action sind ebenfalls für jeweils 8 Prozent der Nutzer Faktoren wichtig wie eine automatisierte Mustererkennung und das Aufspüren von Anomalien durch eine AIOps-Lösung. Auch die Möglichkeit, Machine-Learning-Funktionen zu erweitern und anzupassen, sowie ein Big-Data-Management stehen auf der Wunschliste weit oben.

Den Menschen mitnehmen

Unternehmen, die AIOps-Systeme einsetzen wollen, sollten jedoch nicht nur auf technische Funktionen, Bereitstellungsmodelle und Betriebskosten achten. Damit solche Lösungen den erhofften Nutzen bringen, müssen sie von CIOs und IT-Administratoren akzeptiert werden. Das setzt voraus, dass die Fachleute jederzeit Herr der Lage bleiben. „Automatisierung ist gut, wenn wir die Vorteile von Systemen nutzen. Zum Beispiel empfehlen wir, dass dem User zum richtigen Zeitpunkt aufgezeigt wird, dass es einen ähnlichen Vorfall in der Vergangenheit gab, zusätzlich wird darauf verwiesen, wer diesen Vorfall auf welche Weise bearbeitet hat“, erläutert Guy Fighel. „Doch die Entscheidung, wann was umgesetzt wird, trifft am Ende der Mensch, nicht ein AIOps-System.“
Axians wiederum warnt, Insellösungen zu schaffen: „Es reicht nicht, eine AIOps-Abteilung zu gründen, neue Tools zu kaufen und sonst alles beim Alten zu lassen. Es geht darum, grundlegende Prozesse und Arbeitsweisen zu überprüfen und zu verändern“, stellt Peter Jürß fest. Wer AIOps einführe, müsse sich klar sein, dass diese Veränderung alle beteiligten Bereiche betreffe, inklusive des Managements. „Wichtig ist, dass man Vertrauen in die Technologie entwickelt, indem man versteht, was sie tut, und die Ableitungen und Ergebnisse gemeinsam mit Data Scientists bewertet“, so Jürs weiter. 

Fazit & Ausblick

Dass der Zug auch für IT-Operations in Richtung Automatisierung fährt, ist klar: „Die Zukunft des IT-Betriebs ist autonom: Unternehmen benötigen IT-Operations-Ansätze, die zuverlässig geschäftskritische Dienste bereitstellen, sich an Innovationen anpassen lassen und die vorhandenen Ressourcen effizient nutzen“, betont Philippe Vincent, CEO von Virtual Instruments, einem Anbieter von IT-Monitoring- und AIOps-Plattformen. Autonom heißt, dass der Anteil der automatisierten Aufgaben in der IT erheblich zunehmen wird.
Vor allem größere Rechenzentren lassen sich ohne weitgehende Automatisierung nicht mehr betreiben. Gleiches gilt für hybride IT-Umgebungen, die aus Unternehmens-Data-Centern und Cloud-Services unterschiedlicher Anbieter bestehen. Doch auch der Mittelstand und kleine Unternehmen sollten sich mit Technologien wie AIOps beschäftigen. Denn bei ihnen spielt ein weiterer Faktor eine Rolle: Sie haben es schwerer als Großunternehmen, IT-Fachleute zu finden. Und diese Experten sollten sich besser um wichtigere Dinge kümmern als den Betrieb der IT- und Anwendungsumgebung - etwa um die Digitalisierung von Angeboten und Geschäftsprozessen.
Tabelle:

5. Teil: „Im Gespräch mit Stéphane Estevez von Splunk“

Im Gespräch mit Stéphane Estevez von Splunk

  • Stéphane Estevez: Spezialist IT-Operations bei Splunk
    Quelle:
    Splunk
Mit AIOps können IT-Abteilungen ein proaktives Management von Aufgaben im Bereich IT-Operations einführen. Von jetzt auf gleich lässt sich so eine Lösung aber nicht gewinnbringend einführen.
Kritische Faktoren dabei sind vor allem die Qualität der Daten und die Integration der Informationsbestände, berichtet Stéphane Estevez, Spezialist IT-Operations bei der Datenplattform Splunk, im Gespräch mit com! professional.
com! professional: AIOps ist ein weites Feld. Wo sieht Splunk die wichtigsten Einsatzmöglichkeiten für KI im IT-Betrieb?
Stéphane Estevez: Das Ziel ist es, mit Hilfe von AIOps eine Vielzahl von IT-Betriebsprozessen und -aufgaben zu verbessern und teilweise zu ersetzen, einschließlich Verfügbarkeit und Leistungsüberwachung, Korrelation und Analyse von Ereignissen sowie Automatisierung von Prozessen. Bei Splunk wollen wir das Potenzial all dieser Daten nutzen, um geschäftsrelevante Ergebnisse zu erzielen. Der Schlüssel liegt in einem Zugriff auf alle Daten, inklusive Dark Data (bislang ungenutzte Daten) und einer vereinfachten Datenanalyse.
com! professional: Marktforscher argumentieren, dass KI zusammen mit Lösungen für Monitoring und Application Performance Management weitergehende Analysen erlaubt. Stimmt das?
Estevez: Ja, maschinelles Lernen kann helfen, Geschäftsprozesse abzubilden, zu visualisieren und zu verbessern. Kombiniert man die Datenquellen von IT-Operations und von Applikationen, erhält man einen leistungsstarken Ansatz für das Business Process Mining, der dazu beitragen kann, Ausfälle und Engpässe zu vermeiden und die Prozessleistung zu verbessern.
com! professional: Wo sehen Sie die Hauptvorteile von AIOps?
Estevez: Durch die Verbindung von Maschinendaten und ma­schinellem Lernen zur Klassifizierung, Korrelation, Vorhersage, Anomalie-Erkennung und Ursachenanalyse bekommt man einen intelligenten Ansatz für AIOps und schafft eine moderne IT-Organisation. IT-Teams sind damit dann in der Lage, Betriebsstörungen proaktiv und in Echtzeit zu verhindern beziehungsweise zu beheben.
com! professional: Wie stehen Unternehmen dem Einsatz von KI und maschinellem Lernen im Bereich IT-Betrieb gegenüber?
Estevez: Alle neuen technologischen Trends neigen dazu, am Anfang einen gewissen Widerstand zu erzeugen. Obwohl maschinelles Lernen seit vielen Jahrzehnten diskutiert wird, sehen wir erst jetzt erste Anwendungen in Unternehmen und ziehen klare Vorteile daraus.
com! professional: Können Sie ein deutsches Unternehmen nennen, das die AIOps-Lösung von Splunk einsetzt?
Estevez: Ein Beispiel ist unser Kunde Zeppelin. Das Unternehmen hat mit unserem Machine-Learning-Toolkit ein Anomalie-Erkennungsmodell entwickelt, um Ausfälle von Zündkerzen zu prognostizieren. Dies wirkt der Hauptursache für das Abschalten von Kraftwerken entgegen. Die im AIOps-System bereits vorhandenen Algorithmen und die einfache Implementierung des Machine-Learning-Toolkits ohne Programmierung von Codezeilen haben sich als großer Vorteil für das Team von Zeppelin erwiesen. Mit Hilfe von Automatisierung werden Inkonsistenzen bei der Reaktion auf Probleme reduziert, schwer zu behebende Fehler beseitigt und Ressourcen geschont. Denn die IT-Abteilung kann sich fortan auf Analyse und Optimierung der Prozesse konzentrieren - ein echter Gewinn für das Unternehmen.
com! professional: Welche Herausforderungen sieht Splunk bei der Implementierung und beim praktische Einsatz von AIOps?
Estevez: Es gilt ein wichtiger Grundsatz: Nichts ist möglich ohne eine gute Datenqualität. Erst die schafft die Grundlage dafür, anhand von Daten geschäftsrelevante Entscheidungen und Handlungen zu initiieren und durchzuführen. Wir haben Tausende von Kunden weltweit. Im Allgemeinen fällt es ihnen schwer, auf alle ihre Daten zuzugreifen. Viele Unternehmen versuchen, die Informationen in einer riesigen Datenbank zu strukturieren. Aber dieser Ansatz ist nicht für heutige Bedingungen in komplexen und vernetzten IT-Umgebungen ausgelegt.
com! professional: Warum nicht?
Estevez: Die Daten vorab zu strukturieren ist schlicht unmöglich, angesichts des enormen Volumens, der Vielfalt und der hohen Geschwindigkeit, in der Daten generiert werden. In dem Moment, in dem der IT-Verantwortliche seine Daten strukturiert, verliert er die Möglichkeit, Fragen anzupassen und künftig neue Fragen zu stellen und entsprechende Antworten zu erhalten. Dazu müsste er die Daten immer wieder neu strukturieren, etwa wenn sich eine Datenquelle ändert oder er dem IT-Stack eine neue Technologieschicht hinzufügt. Viele Unternehmen konsolidieren und aggregieren Daten und ermitteln Durchschnittswerte, wodurch die Datentreue beeinträchtigt wird. Eine moderne AIOps-Plattform sollte jedoch in der Lage sein, große Datensätze aller Art aus der gesamten Umgebung zu erfassen und gleichzeitig die Datentreue für eine umfassende Analyse beizubehalten.
com! professional: Wie lassen sich Daten aus unterschiedlichen Quellen in eine AIOps-Lösung einbinden?
Estevez: Zwar gibt es viele Optionen, Daten in eine AIOps-Lösung zu integrieren, grundsätzlich zeigt sich aber: Je mehr Add-ons wie Apps oder Integrationen vorhanden sind, desto besser. Add-ons helfen nicht nur, schneller Daten aufzunehmen, sondern bieten häufig auch vordefinierte Visualisierungen für eine schnellere Wertschöpfung. Zudem helfen solche Erweiterungen, mehr Datenquellen zu erfassen. Es gilt: Je mehr Datenquellen, desto besser ist es. Dabei geht es nicht darum, wie viele Machine-Learning-Algorithmen man verwendet, sondern wie man sie einsetzt und welche Datenquellen man nutzt. Unternehmen benötigen nicht viele Algorithmen, um Anomalien zu erkennen, solange sie diese auf den gesamten Stack anwenden können - von Legacy-Systemen wie Mainframes bis hin zu IoT-Komponenten und nativen Cloud-Apps wie Microservices. Dadurch lassen sich blinde Flecken vermeiden.

mehr zum Thema