Процесс управления инцидентами и запросами пользователей – наиболее зрелая практика управления во многих современных ИТ-организациях. [1] Для многих руководителей он является одним из основных источников численной информации и о качестве поддержки пользователей, и о качестве предоставляемых услуг, и о загрузке персонала. Процесс управления инцидентами – это процесс уменьшения или исключения отрицательного воздействия (потенциальных) нарушений в предоставлении ИТ-услуг, обеспечивая, таким образом, наиболее быстрое восстановление работы пользователей. [2] Для выполнения этой задачи производится регистрация, классификация и назначение инцидентов соответствующим группам специалистов, мониторинг хода работ по разрешению инцидентов, решение инцидентов и их закрытие. Так как это требует тесного взаимодействия с пользователями, фокусной точной процесса управления инцидентами обычно является функция Service Desk, которая играет роль центра контактов пользователей с «внутренними» коллективами технических служб. Управление инцидентами является важнейшей основой для работы других процессов ITIL, представленных на рисунке 1, и предоставляет ценную информацию об ошибках в работе ИТ-инфраструктуры.
Рисунок 1 – Процессы ITIL
Рисунок 2 – Схема процесса «Управление инцидентами»
Библиотека ITIL использует широкое определение термина «инцидент», поэтому почти все обращения пользователей могут регистрироваться и отслеживаться как инциденты. [5]
В книге «Поддержка услуг» библиотеки ITIL дается следующее определение: инцидент – это любое событие, не являющееся частью стандартных операций по предоставлению услуги, которое привело или может привести к нарушению или снижению качества этой услуги. [6]
Акционерное общество «Белорецкий металлургический комбинат» - один из основных производителей металлопродукции и метизов в РФ. Предприятие занимается производством металлопродукции для различных кампаний и целей, а также реализацией и доставкой посредством перевозки грузов на железнодорожных маршрутах и автодорогах Российской Федерации.
Территория комбината является полномасштабным производством металлопродукции и метизов, а также «складом» готовых к продаже металлоизделий. Также на территории комбината определено множество цехов для производства и обработки металлоизделий. Доставка и принятие ресурсов и готовой продукции осуществляется в транспортном и ЖД цехах, у которых в распоряжении имеется несколько ЖД-станций и собственные железнодорожные пути.
С точки зрения организационно-правовой формы БМК является акционерным обществом, партнёр ПАО «Мечел».
Основные цели предприятия:
− повышение рейтинга продаж;
− повышение качества продукции;
− качественное обслуживание и предоставление полной сферы услуг;
− сотрудничество с головным предприятием (Мечел), а также привлечение к сотрудничеству других мировых линий производства проволоки;
− извлечение прибыли.
Предмет деятельности предприятия:
− производство металлопродукции;
− поставка продукции. [7]
В статье рассматривается автоматизация обработки инцидентов, которая первоначально включает в себя систематизацию инцидентов, возникающих на БМК. Информационное обслуживание подразделений предприятия обеспечивает отдел АСУ, основная роль которого – поддержка работоспособности информационных систем. [3] Управление проходит в следующем порядке:
- выявление и регистрация инцидентов;
- классификация и начальная поддержка;
- исследование и диагностика;
- решение и восстановление;
- закрытие;
- владение, мониторинг, отслеживание и связь.
Среди ИТ-инцидентов, возникающих на БМК, можно выделить следующие:
- недоступность информационных систем;
- недоступность корпоративной сети и ИТ-сервисов для всех или для значительной части пользователей;
- недоступность систем, используемых руководством компании для принятия решений;
- повреждение оптоволоконного кабеля, обеспечивающего связь с провайдером;
- отключение электричества и невозможность задействовать резервные источники питания;
- потеря сети хранения данных;
- атака на критически важные системы и сервисы;
- заражение вирусами компьютеров с критически важными приложениями и сервисами;
- потеря внутренних систем доменных имен, контролера домена и других базовых серверов;
- потеря критических баз данных.
В таблице 1 представлены сервисы и краткая характеристика инцидентов, возникающих в них. [4]
Таблица 1 – Сервисы и краткая характеристика ИТ-инцидентов
Сервис |
Инциденты |
Коммутаторы, маршрутизаторы |
- отключение порта коммутатора или маршрутизатора; - аппаратные проблемы с оборудованием (вентиляторы, бесперебойное питание и прочее); - отсутствие связи с коммутатором или маршрутизатором; |
Серверы |
- выход сетевых карт серверов из строя; - сбой сервиса совместного доступа к данным; - аппаратный или программный сбой контроллера; - потеря внутренней системы доменных имен; - потеря одного или нескольких серверов, на которых работают виртуальные машины; |
Интернет |
- неудовлетворительная скорость доступа; - отсутствие доступа к Интернет-ресурсам; - необходимость в перезапуске прокси-сервера; - повреждение оптоволоконного кабеля, обеспечивающего связь с провайдером; |
Терминал отделов |
- отсутствие отклика сессии; - невозможно распечатать из сессии |
Терминал филиала |
- выход принтера из строя; - разрыв соединения с сервером; - необходимость в перезапуске сервера; |
Локальная сеть |
- отсутствие доступа к локальной сети; - отсутствие доступа к сетевым ресурсам; - неудовлетворительная скорость работы сети; |
Офисная техника |
- выход сканер из строя; - необходимость в заправке картриджа лазерного принтера; - неудовлетворительное качество печати на принтере; |
Рабочая станция |
- выход монитора из строя, неудовлетворительное качество изображения; - сообщение антивирусной программы о наличии вируса на компьютере; - требуется настройка режима видеокарты; |
ПО |
- недоступность важных информационных систем; - недоступность корпоративной сети и ИТ-сервисов для всех пользователей или для значительной их части; - недоступность систем, используемых руководством предприятия; |
ИО |
- потеря критически важных БД; - потеря сети хранения данных; |
ИБ |
- атака на критически важные системы и сервисы; - передача данных в непредусмотренном формате; - одновременное открытие нескольких сеансов в системе; - попытка несанкционированного доступа к информации; - неавторизованное использование системы для обработки и хранения данных; |
Необходимо вести журнал регистрации инцидентов, где учитывается время обнаружения, данные сотрудника, обнаружившего инцидент, категорию инцидента, затронутые активы, планируемое и фактическое время решения инцидента, а так же работы, проведенные для устранения инцидента и его последствий, т.к. это способствует оптимизации процесса решения инцидента. [8]
Внедрение процесса управления инцидентами способствует снижению отрицательного воздействия на бизнес со стороны инцидентов, достигаемое за счет повышения эффективности и сокращения временных затрат на их устранение, определению необходимости расширения и проведения изменений важных для бизнеса систем; обеспечению доступности управленческой информации, необходимой для бизнеса.
Ряд полезных качеств приобретает и работа ИТ-подразделения, таких как: усовершенствованный мониторинг, улучшенная информация для управления качеством обслуживания, оптимизированная загрузка сотрудников и более эффективное выполнение ими работы, минимизация потерь и некорректного учета инцидентов и запросов, более точное ведение базы данных, качественное удовлетворение всех потребностей заказчиков.
Работа же без внедрения процесса управления инцидентами может обернуться рядом неприятностей. Отсутствие ответственных лиц за устранение и эскалацию инцидентов может привести к ошибкам при устранении инцидентов и значительно снижает качество обслуживания. Отвлеченность специалистов службы поддержки от исполнения своих обязанностей приводит к снижению эффективности их труда. Пользователи для устранения инцидентов вынуждены общаться друг с другом, отвлекаясь от своих основных обязанностей. Каждый раз необходимо заново проводить анализ инцидентов, в том числе тех, возникновение которых происходят регулярно и которые должны быть известны.