<b>Масштабирование хранилища ломается не на дисках, а на границах согласованности</b>
Распределённое хранилище можно расширять по ёмкости почти линейно, но по задержкам и операционным рискам — нет. Анализ показал, что узкие места обычно возникают в трёх слоях: метаданные, репликация и восстановление после отказа.
При росте кластера проверьте:
— как распределяются владельцы шарда и лидеры;
— сколько запросов уходит на координацию, а не на чтение данных;
— что происходит с ребалансировкой при выпадении узла;
— укладывается ли восстановление в допустимое окно, если теряется не один, а несколько дисков.
Дальше важен профиль нагрузки. Объектное хранилище обычно масштабируется иначе, чем блочное или файловое: там, где чтение терпит горизонтальный рост, запись часто упирается в quorum, журналирование или синхронную репликацию. Данные подтверждают следующую корреляцию: чем сильнее система зависит от централизованных метаданных, тем раньше появляется плато по производительности.
Практика простая: сначала измеряйте p95/p99 задержек, затем — скорость ребаланса и время восстановления, и только потом добавляйте узлы. Если эти метрики не контролируются, увеличение кластера просто переносит проблему на следующий уровень.
Масштабируемость — это не «больше серверов», а предсказуемое поведение системы при отказах, перекосах и перераспределении данных.
—
Соседний канал в сети: @forex_binary_scandal_arb
Прокси-инфра
@proxy_infra_desk_arb
<b>Масштабирование хранилища ломается не на дисках, а на границах согласованности</b>
Этот пост опубликован в Telegram-канале Прокси-инфра. Подписаться можно по ссылке: @proxy_infra_desk_arb.