SLA и аптайм: как читать обещания провайдера
Разбираем, что значит 99.9 и как проверять компенсации.
SLA кажется простой метрикой, но за цифрами скрываются минуты простоя. 99.9 процента — это до 43 минут в месяц, 99.99 — около 4 минут, а 99.5 может означать часы недоступности. Поэтому сначала оцените, какую длительность простоя ваш бизнес действительно выдержит. Для магазина в пиковые часы требования будут строже, чем для тестовой среды.
Дальше изучите исключения. Многие провайдеры не считают плановые работы, форс мажоры и внешние DDoS атаки, поэтому реальный SLA может быть ниже. Важно знать, как фиксируются инциденты и какие доказательства нужны для компенсации. Также смотрите, есть ли понятные каналы уведомлений и время реакции на критические заявки.
Проверяйте SLA независимыми инструментами. Внешние пинги и логирование позволяют сопоставить обещания с фактами, а отзывы помогают увидеть типичные проблемы. Хорошая практика — хранить свою телеметрию и иметь мониторинг из нескольких регионов. Тогда спорные случаи решаются быстрее, а история доступности остается у вас.
Финальный выбор делайте с учетом рисков. Если простой стоит дорого, отдайте приоритет провайдерам с четким регламентом и стабильной репутацией. Для менее критичных задач можно выбирать более доступные тарифы. Главное — не смотреть только на процент, а оценивать весь процесс поддержки и прозрачность учета инцидентов.
Проверяйте, как считается аптайм. Одни провайдеры исключают плановые окна, другие считают только сеть. Запустите внешний мониторинг с нескольких точек и сравните цифры за месяц. Это показывает реальную стабильность и помогает вести разговор по SLA.
Компенсации по SLA часто символические, поэтому лучше строить архитектуру с учетом отказов. Используйте репликацию, отдельные бэкапы и тест восстановления. Если сервис критичен, продумайте резервный план и возможность быстрого переноса.
Смотрите SLA по компонентам: сеть, диски, панель и поддержка. Важны правила уведомлений о работах и инцидентах. Наличие регулярных отчетов и RFO говорит о зрелости процессов.
Не забывайте о метриках приложения. Даже при идеальном аптайме база может быть перегружена или диск медленный. Настройте собственные SLO и следите за ними, иначе SLA провайдера не спасет бизнес.