Что такое MTTR? Значения, использование и шаги для реализации

22 июля 2021 г.

Отслеживание того, как ваши информационные системы реагируют на сбои и ошибки, может помочь вам построить более отказоустойчивую систему и улучшить свои стратегии реагирования. Ключевые показатели производительности, такие как MTTR, могут помочь вам собрать данные о вашей ИТ-команде, физических системах и сетях. Анализ MTTR может помочь вам понять сильные стороны вашей команды и увидеть, как улучшить свою работу, выявляя тенденции производительности. В этой статье мы обсудим, что означают варианты MTTR, когда их использовать и как вы можете реализовать их на своем рабочем месте.

Что такое МТР?

MTTR — это аббревиатура для нескольких ключевых показателей эффективности или KPI, которые относятся к области информационных технологий. MTTR может относиться к среднему времени ответа, восстановления, ремонта или разрешения. Метрики измеряют гибкость ИТ-отдела в решении проблем клиентов. Вот значения каждого термина:

  • Среднее время реагирования. Среднее время реагирования — это среднее время, необходимое вашей команде для реагирования на сбой и восстановления после него, измеряемое с момента получения оповещения.

  • Среднее время до восстановления: среднее время для каждого сбоя системы, от начала сбоя до момента, когда вы проверили систему и снова обнаружили, что она полностью функциональна.

  • Среднее время ремонта. Среднее время, затрачиваемое техническими специалистами на ремонт и тестирование системы до тех пор, пока она снова не станет полностью функциональной, является средним временем ремонта.

  • Среднее время решения: Среднее время решения включает в себя время, необходимое для понимания и устранения проблемы, но также включает время, необходимое для предотвращения проблемы в будущем, поэтому оно, как правило, больше, чем среднее время устранения.

Когда использовать MTTR

Правильное время для применения каждого типа MTTR разное, поэтому важно понимать различия. Вот несколько подходящих случаев для использования каждого типа:

  • Среднее время ответа: этот показатель отделяет время, необходимое для срабатывания сигнала тревоги, от времени, которое требуется вашей команде для его устранения, поэтому он может быть полезен для измерения производительности команды. Сравнение среднего времени восстановления и среднего времени ответа может быть полезным для выявления задержек в вашей системе оповещения.

  • Среднее время восстановления: этот показатель отслеживает общее время простоя. Он может быть наиболее полезен для определения общей производительности системы, поскольку он предоставляет общие данные о сбоях, а не контекст, в котором они произошли, или сведения о том, как вы их устранили.

  • Среднее время ремонта. Этот показатель отслеживает производительность отдельных лиц или групп, решающих проблемы с ремонтом, поэтому он лучше всего подходит для измерения производительности человека, а не устойчивости системы.

  • Среднее время решения. Среднее время решения отлично подходит для измерения незапланированных инцидентов и простоев, поскольку оно отслеживает, насколько хорошо команда реагирует в условиях стресса. Для запросов на обслуживание вы обычно прогнозируете среднее время решения до начала ремонта, чтобы свести к минимуму его влияние, поэтому вы можете не так много узнать, измеряя среднее время решения.

Преимущества MTTR

Метрики MTTR могут помочь вам отслеживать реакцию на системные проблемы и повысить производительность вашей команды. Вот некоторые конкретные преимущества показателей MTTR:

Получить понимание

Понимание того, как ваша команда реагирует на проблемы, может быть сложным процессом, но конкретные цифры, такие как показатели MTTR, могут быть отличным способом получить общее представление о том, как ваша команда подходит к решению проблем. Вы можете лучше понять пользовательский опыт, когда увидите среднее время простоя из-за системных ошибок и ремонтов. Данные с течением времени могут показать вам, есть ли сезонные проблемы с ремонтом или пики простоев в течение месяца или года.

Отслеживание эффективности

Показатели MTTR отслеживают скорость, с которой ваша команда реагирует на проблемы, поэтому их отслеживание может помочь вам увидеть производительность команды с течением времени. Эти показатели также могут отражать эффективность вашей команды таким образом, чтобы их было легко представить в отчетах и ​​они были доступны руководителям или коллегам за пределами ИТ-отдела. MTTR также может быть полезен для постановки измеримых командных целей и отслеживания прогресса в их достижении.

Начать общение

Отдельные KPI, такие как четыре показателя MTTR, могут не предоставить достаточно данных для понимания масштабов производительности вашей команды, поскольку они не учитывают сложности, такие как различные стратегии реагирования и обостряются ли проблемы с течением времени. Однако регулярный сбор данных о разрешении может показать вам общие закономерности успеха, чтобы вы могли найти положительные тенденции и исследовать, как их воспроизвести. Включение этих цифр в полные отчеты или вместе с другими ключевыми показателями эффективности может помочь вам понять, что они означают.

Как использовать MTTR

Вот несколько шагов, чтобы использовать MTTR в качестве индикатора производительности в вашем рабочем процессе:

1. Уточните, какой MTTR вы используете

Прежде чем начать, обязательно решите, какой MTTR подходит для отслеживания в вашей ситуации, и сообщите о своем решении всем членам команды. Это может предотвратить неправильное понимание того, что данные могут означать и как они могут быть полезны. Если вы потратите время на то, чтобы решить, какой MTTR использовать, это также может помочь вам прояснить собственную цель сбора данных.

2. Рассчитайте общее время

Во-первых, подсчитайте общее время, которое вы или ваша команда потратили на ремонт в течение периода времени, который вы измеряете. Если вы собираете данные для крупного отчета, вам может понадобиться рассчитать MTTR за более длительный период, например за месяц или квартал. Данных за отдельные недели может быть достаточно, если вы используете метрики для внутреннего использования или для обратной связи с командой. Вы также можете решить, хотите ли вы учитывать все часы или только время, потраченное в рабочее время на решение этой проблемы.

3. Разделить на количество инцидентов

Затем разделите общее время на количество отдельных инцидентов, с которыми вы столкнулись. Это дает вам среднее или среднее время, которое требуется вашей команде для обработки этих инцидентов. Важно, чтобы ваше количество инцидентов было точным, особенно при измерении MTTR за более короткие периоды времени, потому что это может радикально изменить ваши результаты.

4. Применить MTTR

Рассчитав MTTR, вы можете использовать его в качестве данных для отслеживания производительности команды, производительности системы и прогресса с течением времени. Вы можете начать сбор этой информации автоматически через систему обработки билетов. При использовании MTTR, как и других KPI, не забудьте переоценить, почему вы собираете данные и помогают ли они вам, чтобы не тратить время на сбор бесполезных данных.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *