Я люблю такие истории не за железо, а за логику.
Человек уже сидел на RTX 4080 — и это, на минуточку, отличный GPU. Но для локальных моделей 16 ГБ VRAM быстро превращаются в потолок. Дальше обычно начинается знакомый рынок боли: либо покупать дорогую карту с большим объёмом памяти, либо мириться с ограничениями.
Он выбрал третий путь: взял серверную видеокарту за £200, подключил через адаптер и собрал себе 32 ГБ VRAM на двух GPU. В итоге — локальная модель на 27 млрд параметров и скорость 32 токена в секунду. 🚀
И вот что мне в этом нравится: это не история про «самый мощный ПК», а про правильную архитектуру решения. Не всегда надо апгрейдить всё подряд. Иногда достаточно честно ответить на вопрос: что именно упирается в потолок — и обойти его самым простым способом.
Для команд, которые любят Tilda-логикой мыслить про digital-стек, это очень знакомый урок: не переплачивай за “идеальное”, если можно собрать рабочее и экономное.
Tilda Brief
@TildaBriefPro
Я люблю такие истории не за железо, а за логику.
Этот пост опубликован в Telegram-канале Tilda Brief. Подписаться можно по ссылке: @TildaBriefPro.