Blog

Erste Schritte mit AIOps

Geschrieben von am Februar 23, 2021

Erste Schritte mit AIOps 1

"Houston, wir haben ein Problem."

Dies ist genau das, was die Mitarbeiter im IT-Betrieb denken, wenn eine Reihe von Überwachungswarnungen gleichzeitig ausgelöst wird. Innerhalb von fünf Minuten erhalten sie die Einladung zum Bridge-Anruf und beginnen zu lesen, was jeder Monitor meldet. Das Team überprüft in Cherwell aufgetretene Vorfälle, Netzwerkwarnungen von Nagios, Systemwarnungen in LogicMonitor, Protokolldateien in Splunk und Jenkins-Bereitstellungen, um mögliche Ursachen zu identifizieren und eine Vorgehensweise zu bestimmen.

Erste Schritte mit AIOps 4

Nach einer Viertelstunde nach dem Anruf erhalten die Unternehmensleiter den Status und erinnern alle an die erwarteten Service-Levels für geschäftskritische Anwendungen. Unternehmensleiter haben höhere Erwartungen an die Zuverlässigkeit und Leistung des Systems, insbesondere an kundenorientierte Anwendungen und kritische Workflows.

Die Verwaltung von IT-Operationen kann stressig sein, und AIOps ist eine Lösung, mit der die IT die Systemzuverlässigkeit und Kundenzufriedenheit verbessern und gleichzeitig einen Teil der manuellen Arbeit reduzieren kann.

Was ist AIOps?

Proaktive IT-Verantwortliche Wenden Sie AIOps-Funktionen an, um die Komplexität zu verringern, die Mitarbeitererfahrung zu verbessern und das Serviceniveau zu verbessern.

AIOps bezieht sich auf die Anwendung von KI- und maschinellen Lernfunktionen zur Unterstützung des IT-Betriebs. Ein unverzichtbares Ergebnis von AIOps hilft der IT, mehrere Überwachungswarnungen zu einem einzigen, zeitlich geordneten Vorfall zu korrelieren, der einfacher zu überprüfen und schneller zu lösen ist. Möglicherweise wird angezeigt, dass eine Bereitstellung von Continuous Integration (CI) / Continuous Delivery (CD) Datenbankfehler gefolgt von Anwendungsfehlern auslöste und diese zu einem einzigen Vorfall zusammenfasste. Ein Incident Manager, der diese Sequenz sieht, kann schnell die Grundursache ableiten, das Entwicklungsteam zu den letzten Änderungen konsultieren und die erforderlichen Schritte zur Wiederherstellung des Dienstes festlegen.

AIOps beim Incident Management und bei der Verarbeitung von Daten aus mehreren Überwachungstools ist ein Anwendungsfall für Plattforminformationen. Die Anwendung von KI und maschinellem Lernen im IT-Betrieb umfasst auch:

  • Ermittlungs- und Abhängigkeitszuordnung (DDM) Automatisierungen zur Erfassung von Änderungen der Hybrid-Cloud-Infrastruktur, zur Pflege der CMDB und zur Erfassung von Abhängigkeiten zwischen Systemen.
  • Virtuelle Agenten Verwenden Sie NLP (Natural Language Processing), um Endbenutzern beim Suchen und Zugreifen auf den Servicekatalog zu helfen.
  • Stimmungsanalyse für Endbenutzer-Feedback kann bei negativer Kundenreaktion ein Follow-up durch den IT-Service-Desk auslösen.
  • Durch die Kategorisierung von Anforderungen durch maschinelles Lernen können die Zuordnung von Anforderungen zu den richtigen Diensten verbessert und an das richtige Team weitergeleitet werden.

Da mehrere Funktionen für maschinelles Lernen verfügbar sind, sollten IT-Verantwortliche die folgenden Schritte berücksichtigen, um mit AIOps zu beginnen.

1. Konfigurieren Sie die AIOps-Datenquellen

Algorithmen für maschinelles Lernen erfordern saubere Datenquellen. Die ersten Schritte zur Aktivierung der AIOps-Funktionen bestehen darin, Datenquellen zu verbinden und ihre Konfigurationen zu durchlaufen.

IT-Teams sollten mit der Konfiguration beginnen DDM zum Erfassen von System-, Netzwerk- und Anwendungsdaten aus Rechenzentren, privaten Clouds und öffentlichen Clouds, einschließlich AWS und Azure. DDM sollte die CMDB regelmäßig aktualisieren, und IT-Betriebe sollten dann Systeminformationen Geschäftsdiensten und Service-Levels zuordnen.

ITSM-Praktiken wie Incident Management und Change Management haben viel mehr Kontext mit a CMDB mit DDM-Unterstützung. Vorfälle und Änderungstickets erfassen bereits, was passiert ist, und mit einer integrierten CMDB mit DDM-Unterstützung können die Tickets auch angeben, wo sie passiert sind. Der hinzugefügte Kontext hilft der IT, Probleme schneller zu lösen, und ermöglicht die Analyse wiederholter Problembereiche.

Erste Schritte mit AIOps 3

Zweitens verbinden Sie alle System-, Netzwerk- und Anwendungsüberwachungstools mit einer Zentrale AIOps-Lösung. Diese Lösung sollte das Rauschen bei der Überprüfung mehrerer Überwachungstools reduzieren, indem mehrere Warnungen mit einem verwaltbaren Vorfall korreliert werden. Durch das Verbinden der Datenquellen werden auch historische Daten für die prädiktive Analyse und die Erkennung von Anomalien erfasst, sobald genügend Daten zum Trainieren von Algorithmen für maschinelles Lernen vorhanden sind.

2. Entdecken Sie ITSM-Schmerzpunkte und -chancen

Sobald die IT DDM mit der CMDB verbindet und Überwachungsdaten aggregiert, ist es Zeit, die Daten zu verwenden und die KPIs zu verbessern. Die IT sollte nach Möglichkeiten suchen, um die Kundenzufriedenheit, die mittlere Zeit zur Lösung von Problemen (MTTR) und die Systemzuverlässigkeit zu verbessern.

Proaktive IT-Betriebsteams betrachten diese Verbesserungen strategisch, indem sie die folgenden Schritte ausführen:

  1. Auflisten und Priorisieren von betrieblichen IT-Schwachstellen aus Incident Management, Request Management und Services mit geschäftlichen Auswirkungen.
  2. Überprüfen Sie die Daten und Erkenntnisse in DDM und überwachen Sie die Einsichtstools und führen Sie eine Datenerkennungsübung durch. Identifizieren Sie: „Was sagen Ihnen die Daten?“ Und welche Verbesserungsmöglichkeiten die Daten vorschlagen.
  3. Richten Sie die Schmerzpunkte auf die Möglichkeiten aus, Fokusbereiche zu priorisieren.
  4. Bestimmen Sie Stakeholder, die Prozessverbesserungen steuern und Erfolgskriterien formulieren können.
  5. Identifizieren Sie, welche Metriken oder KPIs zeigen, ob Verbesserungen die ausgewählten Erfolgskriterien erfüllen.

Diese Schritte stellen sicher, dass die IT einen Geschäftspartner für die Implementierung gewinnt und Anstrengungen in Bereiche investiert, die die größten geschäftlichen Auswirkungen haben.

3. Verwenden Sie Agile Processed, um Lösungen zu implementieren

Dieser Prozess der Identifizierung von Stakeholdern, Prioritäten und KPIs hilft auch dabei, einen laufenden Verbesserungsprozess zu definieren. Da Teams datengesteuerte Erkenntnisse nutzen, um Chancen zu identifizieren und mit Stakeholdern in Bezug auf Schwachstellen zusammenzuarbeiten, sollte ein Rückstand an Projekten zur Prozessverbesserung entstehen.

Der Rückstand ist genau das, was proaktive IT-Verantwortliche bei der Implementierung von AIOps-Funktionen benötigen. Diese Führer sollten sich bilden Agile Teams im IT-Betrieb Verbesserungen iterativ umzusetzen.

Warum ein agiler Prozess? Die Prioritäten ändern sich wahrscheinlich aufgrund der Geschäftsanforderungen, -chancen und -risiken. Das Team könnte sich in den ersten Sprints auf Endbenutzer-Computeranwendungen konzentrieren, um hybride Arbeitsumgebungen zu unterstützen. Die Gruppe arbeitet dann möglicherweise mit einem Anwendungsentwicklungsteam zusammen, das Anwendungen modernisiert und in die Cloud migriert.

In beiden Szenarien helfen Topologiekarten, Infrastrukturvisualisierungen und andere DDM-Tools dem Team, Implementierungsmöglichkeiten zu identifizieren.

Erste Schritte mit AIOps 2

Angenommen, Endbenutzer öffnen Incident-Tickets für eine langsame Reaktionszeit der Anwendung am Nachmittag. Der Topologiebericht des DDM kann IT-Mitarbeitern dabei helfen, den Engpass zu identifizieren, indem Anwendungsflüsse zwischen schlechten und normalen Leistungsperioden verglichen werden. Das Team kann dann die Parameter für die Wolkenelastizität anpassen, um die Infrastruktur in den Engpassbereichen vor Spitzenzeiten hochzufahren. Nach den Änderungen überwacht das Team die Leistung und Vorfälle, um zu überprüfen, ob die Änderung das Problem behoben hat.

Verwenden Jahr AIOps-Lösung, einschließlich einer DDM-Teilmenge einer Lösung, ermöglicht diesen datengesteuerten Zyklus der Prozessverbesserung. Maschinelles Lernen in DDM und AIOps reduziert die Komplexität der Arbeit mit mehreren Datenquellen oder veralteten Daten. Stattdessen kann sich die IT auf den Kunden konzentrieren, Schwachstellen verstehen, Lösungen implementieren und Ergebnisse validieren. Das Ergebnis ist ein proaktives IT-Betriebsteam, das die Systemleistung ständig verbessert und den Geschäftsinteressenten eine stärkere Systemleistung bietet.

Steigern Sie die Agilität und automatisierte Servicebereitstellung für Ihr Unternehmen, indem Sie eine Demo der AIOps-Lösung von Cherwell planen.

Eine Demo anfordern

Isaac Sacolick, Präsident von StarCIOführt Unternehmen durch intelligentere, schnellere, innovativere und sicherere digitale Transformationsprogramme, die Geschäftsergebnisse liefern. Er ist der Autor des Amazon-Bestsellers, Driving Digital: Der Leitfaden für Unternehmen zur Transformation von Unternehmen durch TechnologieIndustrie Lautsprecherund Blogger bei Sozial, agil und Transformation.

Das könnte Sie auch interessieren

Erfahren Sie mehr über unsere Updates zu den Cherwell Knowledge-Artikeln