У Т-Банка 11 июня посыпалась инфраструктура: первые жалобы пошли около 12:00 МСК, а к 13:50 DownDetector уже показывал больше 1,9 тыс. обращений. Легли сразу несколько точек входа — мобильное приложение, личный кабинет и переводы.
Что это обычно значит технически: проблема не обязательно в одном сервисе, чаще всего это цепочка. Например, авторизация отвечает, но падает платежный шлюз; или фронт живой, а backend/очереди/anti-fraud не успевают. Для банка это особенно критично: даже краткий сбой в auth или payment orchestration мгновенно превращается в лавину повторных запросов и таймаутов. 📉
Что полезно вынести в рабочий тулкит:
— мониторинг не только uptime, но и бизнес-метрик: логин, перевод, создание заявки;
— алерты по росту 4xx/5xx и p95 latency;
— отдельные synthetic checks для мобильного API и web-кабинета;
— graceful degradation, чтобы не валить весь вход из-за одного зависшего сервиса.
Если вы строите продукт с платежами или авторизацией, этот кейс — напоминание: «приложение работает» и «пользователь может сделать действие» — это две разные метрики.
DevTools Radar
@DevToolsRadarPro
У Т-Банка 11 июня посыпалась инфраструктура: первые жалобы пошли около 12:00 МСК, а к 13:50 DownDetector уже п
Этот пост опубликован в Telegram-канале DevTools Radar. Подписаться можно по ссылке: @DevToolsRadarPro.