Провайдеры ускоряют переход на NVMe и PCIe 4.0
Новые дисковые пуллы дают больше IOPS, но требуют проверки реальной задержки.
В 2024 году провайдеры массово обновили дисковые пуллы на NVMe и PCIe 4.0. Рекламные цифры выглядят впечатляюще, но реальные задержки зависят от архитектуры и настройки. Клиентам важно проверять показатели в своих тестах.
Скорость последовательной записи выросла, но для баз данных важнее случайные операции и стабильность. Попросите результаты fio с несколькими профилями и замерьте latency. Без этого сложно понять, что вы получите в продакшне.
Некоторые провайдеры используют агрессивный кеш и получают красивые бенчмарки. Через час нагрузки показатели могут падать. Обязательно проверяйте длительные тесты и сравнивайте медианные значения.
Важен и уровень RAID. NVMe в RAID10 часто дает лучший баланс надежности и скорости, но повышает стоимость. Спросите, как устроено резервирование и как выполняются замены дисков.
Для высоких нагрузок имеет смысл разделить горячие и холодные данные. Тогда NVMe используется для базы, а архивы уходят на объектное хранилище. Такой подход снижает стоимость и риск перегрева.
Мы обновили рекомендации по тестированию дисков и добавили примеры команд. Это помогает сравнивать предложения без маркетингового шума.
Если у провайдера есть SLA по диску, уточняйте, что считается инцидентом и как фиксируются деградации. В спорных ситуациях это спасает время.
При переходе на PCIe 4.0 важно проверять не только пиковые IOPS, но и стабильность латентности под нагрузкой. Для баз данных критичны 99-й процентиль и поведение при очередях.
Уточняйте, как устроены пулы и есть ли разделение по классам дисков. В некоторых тарифах NVMe используется как кеш, а основной объем — на более медленных носителях.
Для миграции запланируйте тестовые окна и сравните fio-профили на старых и новых нодах. Это позволяет заранее понять, где будут узкие места.
Также уточняйте показатели износа и политику замены SSD. При высокой записи важно знать, как провайдер контролирует ресурс и планирует замену, иначе риск деградации остается скрытым.
Проверьте, как ограничивается IO на уровне гипервизора. Иногда высокая скорость доступна только короткими всплесками, а в среднем диск ведет себя как SATA. Попросите длительные бенчмарки на 30-60 минут.
Соберите метрики 95/99 перцентиля и держите их в SLO. Это позволит замечать деградацию раньше, чем пользователи.
Также проверьте обновления firmware и контроллеров. От них часто зависит стабильность при долгой нагрузке.