Der Druck auf die IT Budgets, das zunehmende Fehlen von qualifizierten IT-Mitarbeitern und die Anforderung IT-Dienste zeitgerecht und mit hoher Verfügbarkeit anzubieten, erfordert in zunehmendem Maße die Automatisierung von Prozessen. Die Geschwindigkeit mit der vormals manuelle Aufgaben und Abläufe automatisiert werden, nimmt zu. IT-Automatisierung verspricht reduzierte Ausfallrisiken, geringere Kosten und verbesserte IT-Verfügbarkeit. Allerdings erfordert Automatisierung einen hohen Reifegrad der IT und gut ausgebildete IT-Mitarbeiter. Daher ist guter Rat teuer. Eine gute Idee ist es bereits standardisierte Prozesse zu identifizieren, welche einfach zu automatisieren sind.
IT-Alarmierung automatisieren
Wir glauben insbesondere, dass die Automatisierung von IT-Alarmierungsprozessen in Kombination mit dem mobilen Zugriff auf IT-Automationsaufgaben ein hervorragendes Beispiel für einen schnellen Erfolg und einen guten „Return-on-Investment“ ist. In vielen Unternehmen besteht die Alarmierung bei IT-Störungen aus vielen manuellen Schritten. Der Prozess der Alarmierung von IT-Störungen an Betriebspersonal ist leicht standardisierbar, wenn ein gutes Tool verwendet wird und daher ein naheliegendes Feld für die IT-Automatisierung.
1. Ein wesentlicher Punkt der IT-Störungsalarmierung ist die zielgenaue Adressierung der richtigen, verantwortlichen Mitarbeiter. Die Art von Zuständigkeiten (welches Team betreut welche Systeme) sind üblicherweise implizit verfügbar, oft aber auch schon dokumentiert, z.B. in einer CMDB. Mit der richtigen Lösung können solche Zuständigkeiten einfach abgebildet und für einen automatisierten Ablauf verfügbar gemacht werden.
2. Ein zweiter Punkt, der zu beachten ist, ist die Berücksichtigung der zeitlichen Verfügbarkeit von IT-Mitarbeitern, sprich der Rufbereitschaft für die Zeiten außerhalb der üblichen Geschäftszeiten. So etwas für üblicherweise in einem Rufbereitschaftsplan vorgehalten. Anstatt jetzt aber ein entkoppeltes Tool wie z.B. eine Excel-Tabelle oder eine Sharepoint-Seite zu verwenden, kann ein Alarmierungssystem wie Enterprise Alert einen integrierten Rufbereitschaftsplaner anbieten. Auf die gespeicherten Bereitsschaftspläne kann dann vollautomatisch zugegriffen werden und der verfügbare und zuständige Bereitschaftshabende kann alarmiert werden.
3. Ein weiteres kritisches Element der IT-Alarmierung ist die Eskalation, idealerweise in Echtzeit, wenn ein Alarm nicht ausgeliefert oder nicht quittiert wurde. Üblicherweise ist dies ein manueller Vorgang den das NOC-Bereitschaftsteam durchführt. Eine Software mit den technischen Kommunikationsfähigkeiten wie der Echtzeitnachverfolgung der Nachrichtenauslieferung und der 2-Wege-Alarmierung zur Verarbeitung von Quittierungen ist daher die Grundlage für die Automatisierung von Eskalationsabläufen. Die Lösung muss dann in der Lage sein, derartige Ablaufpläne zu speichern. Im Idealfall sind diese vollständig individualisierbar und an die Art oder Schweregrad der Störung anpassbar.
4. Die IT-Alarmierung ist üblicherweise über dem IT-Monitoring angeordnet. Die nahtlose Integration mit diesen Systemen ist daher kritisch, da die Störmeldungen aus dem Monitoring automatisch übernommen werden müssen. Der Grad der Integration spielt für den Automatisierungsgrad eine wichtige Rolle. Idealerweise ist der Zustand einer Störmeldung über alle System synchronisiert. Wird eine Alarm am Mobilgerät quittiert, sollte er auch im Monitoring-System diesen Status haben. Wird eine Störmeldung im Monitoring-System geschlossen eine Störung, muss der Alarmierungsprozess angehalten werden.
5. Da es sich bei nächtlichen Alarmen meist um Notfälle handelt, spielt die Persistenz der Alarmierung eine wichtige Rolle. Ein NOC-Mitarbeiter wird nicht ruhen bis jemand aus dem Bett geklingelt wurde. Eine automatisierte IT-Alarmierungslösung sollte dies ebenfalls tun.
Wenn obige Punkte umfassend abgedeckt sind, steht einer Automatisierung der IT-Alarmierung nicht mehr viel im Weg.
Auf Wiedersehen, manuelle Alarmierung
Die klassischen manuelle Alarmierung kann nun ersetzt werden:
- NOC-Mitarbeiter beobachten stundenlang Monitore
- Und warten auf rot blinkende Symbole
- Sie identifizieren die Störung und das zuständige Team
- Sie sehen nach wer Rufbereitschaft hat
- Sie versuchen den Mitarbeiter telefonisch zu erreichen und geben im eine mündliche Fehlerbeschreibung (eventuell gibt es ein halbautomatisches Tool mit Webmaske zum Alarmversand)
- Es wird manuell eskaliert, wenn niemand erreicht werden kann
- Ein Störungsticket wird erstellt
Dieser gesamte Prozess kann vollständig automatisiert werden und läuft dann unbeaufsichtigt, fehlerfrei und in Echtzeit ab!
Vorteil
Eine Vielzahl von Vorteilen ergibt sich aus der Automatisierung dieses Alarmierungsprozesses:
- Menschliche Verzögerung im Prozess werden eliminiert, der Prozess wird viel schneller
- Es gibt weniger Fehler, z.B. durch Fehladressierung von Alarmmeldungen
- Bei kritischen Störfällen muss sich das NOC-Team nicht um das Anrufen von Bereitschaften kümmern
- Sinnvolle und detailreiche Alarmmeldungen werden automatisch erzeugt
- Das Risiko kritische Störungen zu übersehen wird reduziert
Automatisierte IT-Aufgaben vom Smartphone
Derdack’s Enterprise Alert bietet einen zusätzlichen Vorteil, der zu einer schnelleren Behebung von Störungen führt. Neben der Automatisierung des Alarmierungsvorgangs werden automatisierte IT-Aufgaben direkt vom Smartphone aus ansteuerbar gemacht. Damit wird eine Reaktion und die Behebung von IT-Störungen von unterwegs möglich. Mit der mobilen App von Enterprise Alert können IT-Automationsaufgaben (z.B. Runbooks in PE Operations Orchestration, System Center Orchestrator or Azure Automation) von unterwegs angestoßen werden. IT-Störungen können so untersucht, neutralisiert oder sogar behoben werden – alles vom Smartphone aus!
Wir laden Sie ein mit uns Kontakt aufzunehmen und von unserem Wissen aus zahlreichen Installationen und Prozessautomatisierungen bei führenden Unternehmen wie Daimler zu profitieren.