Incident Management: damit die IT nach einem Störfall schnell wieder läuft

IT Incident Management, zu deutsch Störungsmanagement, beschäftigt sich mit dem Prozess, ungeplante Vorfälle im IT-Betrieb nach festgelegten Zeiträumen zu beheben. Der Incident-Management-Prozess reicht vom Feststellen eines Problems bis zu dessen Lösung. Bei dieser Aufgabe hilft ein Incident Management System. Je nach Vorfall und Komplexität gibt es unterschiedliche Level für den Support: First Level für einfache Vorfälle, Second Level für mittelschwere Vorkommnisse und Third Level für die größten Probleme.

IT Incident Management: Störfälle

Oftmals sind beim IT-Störungsmanagement Service Level Agreements definiert, nach denen sich ein interner oder externer Dienstleister zu richten hat. dms | dmz  unterstützt den Incident Manager im Unternehmen beim Aufbau und der Optimierung einer eigenen Lösung, kümmert sich aber auch komplett um das Management.

Was ist IT Incident Management?

Ein Incident ist eine Störung des IT-Betriebs. Incidents können langsame oder ausgefallene Netzwerke, Datenverluste oder eine nicht mehr funktionsfähige Software sein. Das Störungsmanagement hilft Unternehmen, sich optimal auf solche Situationen vorzubereiten und Abläufe zu definieren, wie die Vorfälle schnell zu beheben sind.

Was sind die Ziele von IT Incident Management?

– Der Normalzustand eines IT-Systems soll schnellstmöglich wiederhergestellt werden.

– Der negative Einfluss auf den Geschäftsbetrieb muss auf ein Minimum reduziert werden.

Das Incident Management ist vom Problem Management zu unterscheiden. Beide orientieren sich an ITIL (Information Technology Infrastructure Library), einem Framework zum Einrichten von Prozessen innerhalb einer IT-Organisation. Beim Störungsmanagement geht es um das schnelle Beheben eines Vorfalls. Demgegenüber widmet sich das Problem Management um die Analyse der tiefer liegenden Ursachen. Damit soll verhindert werden, dass sich der Incident wiederholt. Problem Management agiert vorwiegend präventiv, während der Incident-Management-Prozess eine unmittelbare Reaktion auf die Störung ist.

IT-Störungsmanagement: Support-Ebenen und Ablaufplan

Das Störungsmanagement setzt ein, sobald ein Incident gemeldet wird.
Die Meldung kann entweder durch einen Mitarbeiter erfolgen, per
Mail (zum Beispiel beim Monitoring) oder per SMS. Dabei wird der Sachverhalt zunächst eindeutig geklärt und der Incident detailliert beschrieben. Ein Incident Management System in Form einer Software-lösung erfasst die Inhalte elektronisch und löst am Ende ein sogenanntes “Ticket” aus.

Das Incident Management System nimmt auch die fachliche Aufteilung vor, sodass die Störung konkret einem Mitarbeiter zugeordnet werden kann. Dieser stuft die Dringlichkeit des Vorfalls ein.

First-Level- und Second-Level Support

Support auf Level 1 unterstützt den Anwender auf einem Basisniveau, beispielsweise beim Zurücksetzen von Passwörtern oder bei Bedienfehlern am Computer. Lässt sich die Störung nicht direkt beheben, leitet der Mitarbeiter die Eskalation auf Stufe 2 ein. Der Level-2-Support hilft bei komplexeren Problemen, die eine zusätzliche Schulung, mehr Fähigkeiten oder eine höhere Sicherheitsfreigabe erfordern.

Third-Level-Support für schwere Vorfälle

Besonders schwere Vorfälle, sogenannte Major Incidents, gelangen zum Support auf Level 3. Diese beeinträchtigen den Betrieb eines Unternehmens erheblich. Ein Beispiel wäre ein Problem mit dem Netzwerk oder ein abgestürzter Server. Hier sind Mitarbeiter mit spezifischen Kenntnissen des betroffenen IT-Systems und mit höchster Qualifikation gefragt.

Wurde der Incident erfolgreich gelöst, wird die Lösung im Ticket dokumentiert und ein Feedback eingeholt. Danach ist der Incident abgeschlossen.

Optimale Prozesse sorgen für Qualität

Die beschriebenen Prozesse klingen einfach, sind in der Praxis aber häufig mit Fallstricken versehen. Für die Mitarbeiter muss es klare Regeln geben, damit eine Störung korrekt priorisiert oder eingeordnet werden kann. Ebenso sind Eskalationsregeln für die Weiterleitung an den Second- und Third-Level-Support notwendig. Diese können in den Service Level Agreements (SLAs) festgelegt werden. Die Schnittstellen sind die größte Herausforderung.

dms | dmz: Ihr Partner für das IT Incident Management

dms | dmz verfügt über Spezialisten mit langjähriger Erfahrung im IT Incident Management. Sie bauen das Störungsmanagement für unsere Kunden auf und ergänzen oder optimieren es bei Bedarf.

Falls keine internen Ressourcen vorhanden sind, übernehmen wir in enger Absprache mit dem Kunden den gesamten Incident-Management-Prozess und agiert als externer Incident Manager.

Dabei werden folgende Kennzahlen zur Prozesssteuerung erhoben:

– Gesamtzahl der Incidents.

– Incidents in Bearbeitung.

– Anzahl der schwerwiegenden Major Incidents.

– Zahl der Eskalationsvorfälle.

– Anzahl der gelösten Incidents.

– Anteil der Erstlösungen an den Gesamtlösungen.

– Durchschnittliche Reaktionszeit.

– Durchschnittliche Lösungszeit.

– Erzielte Lösungen nach den Vorgaben des Service-Level-Agreements.

Um diese Daten zu vergleichen, setzt dms | dmz  ein modernes Incident- Management-System ein. Auf diese Weise gelingen präzise Auswertungen, die Einblicke in die Qualität der IT und des Incident Managements ermöglichen.

dms | dmz: IT Incident Management mit professioneller Umsetzung

Wollen Sie eine eigene Incident-Management-Lösung aufbauen oder einen externen Incident Manager beauftragen? Die Experten der dms | dmz group  haben die passende Antwort für Ihr Unternehmen parat.