В инфраструктуре слишком легко спорить «на ощущениях», пока не посмотрим на цифры.
У нормального хостинга есть три метрики, которые говорят больше любых обещаний:
— uptime не ниже 99,9%
— p95 latency в пределах 20–50 мс для целевой аудитории
— время восстановления после сбоя не больше 15–30 минут
Если RTO у вас измеряется часами, а не минутами — это уже не запас по надежности, а лотерея.
Если бэкапы делаются ежедневно, но восстановление никто не тестировал, то это не защита, а архив.
Еще один полезный ориентир: рост CPU выше 70% под пиком — сигнал не «все нормально», а «пора масштабировать до инцидента» 📊
Хорошая инфраструктура не выглядит героически. Она просто держит цифры в зеленой зоне и не дает бизнесу замечать, что серверы вообще существуют.
Резервные Копии
@backup_strategy_ru_n1k
В инфраструктуре слишком легко спорить «на ощущениях», пока не посмотрим на цифры.
Этот пост опубликован в Telegram-канале Резервные Копии. Подписаться можно по ссылке: @backup_strategy_ru_n1k.