DWH без предпроекта — это классика жанра: сначала рисуют “единое хранилище”, потом внезапно выясняется, что источники живут в 7 системах, схемы не совпадают, а данные обновляются с разной задержкой.
Что надо проверить до старта:
1. Источники и частоту обновления. Если один контур шлёт изменения раз в 5 минут, а другой — раз в сутки, единая витрина без SLA развалится.
2. Качество данных. Дубликаты, пустые ключи, разные справочники, мусор в датах — это не “после почистим”, это прямой риск для модели.
3. Объём и рост. 1 ТБ сегодня — не проблема. 20 ТБ через год уже влияет на архитектуру, партиционирование и стоимость хранения.
4. Потребителей. Если BI ждёт агрегации за 2 секунды, а аналитикам нужны сырые события, проект нужен не “один DWH”, а набор контуров с разными SLA.
Главная ошибка — строить целевую архитектуру до замеров. Сначала инвентаризация, потом оценка интеграций, затем нагрузка и только потом дизайн. Иначе получится космический замок на бюджете сарая. 🚧
TechSEO Lab
@TechSEOLabPro
DWH без предпроекта — это классика жанра: сначала рисуют “единое хранилище”, потом внезапно выясняется, что ис
Этот пост опубликован в Telegram-канале TechSEO Lab. Подписаться можно по ссылке: @TechSEOLabPro.