SLA vs SLO vs SLI

В чем разница?

Думаю каждый руководитель технической поддержки обязательно сталкивался с этими понятиями. Но все ли понимают в чем разница между ними?

Чаще всего оперируют понятиями SLA - Service Level Agreement.

SLA - Service Level Agreement

Это то, что пообещали клиенту. Т.е. какое время первого ответа обещается по его обращениям или за какое время проблема будет решена.

Эти соглашения, часто составленные людьми, далекими от техподдержки (юристы и продавцы), бывает содержат обещания, которые достаточно сложно выполнить технически.

Например, SLA может гарантировать, что техподдержка решает проблемы в течение 24 часов. Но то же самое SLA не уточняет, что произойдет, если клиент потратит 24 часа на отправку логов или скриншотов, чтобы помочь вашей команде диагностировать проблему.

Означает ли это, что 24-часовой интервал для команды был исчерпан из-за задержек со стороны клиента, или таймер запускается и останавливается в зависимости от того, когда клиенты отвечают?

SLO - Service Level Objective

Это цель, которую устанавливают для себя специалисты технической поддержки, которую они видят, и могут контролировать. Под “могут контролировать” подразумевается, что контроль над целью полностью лежит на службе поддержки и не зависит от клиента или других отделов. Вторая важная составляющая SLO это то, что цель должна быть такой, чтобы при ее выполнении всегда выполнялся контрактный SLA.

Часто бывает так, что под SLO понимают просто более жесткую , но при этом неконтролируемую, цель по SLA. Если взять пример выше, то просто берут SLO равный 12 часам. В принципе, в каких-то случаях это может работать, но с точки зрения теории это будет просто более жесткий SLA. Для SLO же важно, чтоб его выполнение полностью находилось под контролем службы поддержки.

В Swarmica мы используем модель SLA, где присутствует несколько разных счетчиков, которые могут играть роль, как SLA, так и SLO.

Для SLA обычно используются:

1. Время первого ответа - это может быть и SLA и SLO, т.к. с одной стороны это время полностью контролируется на стороне поддержки, а с другой стороны понятная календарная метрика для клиентов.

2. Полное время решения - его любят по умолчанию указывать в SLA контрактах, т.к. со стороны клиента оно легко принимается и понимается. Однако, как было сказано выше, оно не учитывает время ожидания дополнительной информации со стороны клиента, или например, когда обнаружен баг, и ожидается выход обновления со стороны разработки. Т.е. то, на что поддержка повлиять не может.

Для SLO можно использовать:

1. Время решения без ожидания - это время без учета статуса “Ожидает ответа клиента”, т.е. не учитывается время, пока служба поддержки, что-то ждет со стороны клиента.

2. Время решения в поддержке - в дополнение к предыдущему также не учитывается статус “Отложено” , который чаще всего используется для ожидания каких-то действий со стороны разработки.

В обоих счетчиках выше “мяч” всегда на стороне службы поддержки, а следовательно они могут выставлять себе выполнимые и влияющие на SLA цели.

SLI - Service Level Indicator

Это реальное значение относительно SLA или SLO целей. Т.е. если SLA цель стоит 24 часа, а обращение решено за 10 часов, то SLI относительно SLA будет 10 часов. Еще ее можно представить в качестве отношения обращений с выполненной целью относительно общего количества обращений. Например 90%.

Итого SLI это конкретная метрика, которая показывает насколько агенты выполняют SLA или SLO цели.

Хотите посмотреть вживую?