**Дешёвый прирост VRAM: не всегда нужен топовый GPU**
1. Для локальных моделей упираются не в «мощность», а в **объём памяти**. RTX 4080 с 16 ГБ годится для задач попроще, но для более тяжёлых моделей этого уже мало.
2. Решение оказалось не из retail-сегмента: **серверная видеокарта за £200** через адаптер в обычный ПК. Итог — **32 ГБ VRAM** суммарно на двух GPU.
3. На этой конфигурации запускается модель на **27 млрд параметров** и выдаёт около `32 tok/s`. Для домашней сборки это уже вполне рабочая производительность.
4. Вывод для performance-мышления простой: иногда выгоднее **добавить память дешёвым способом**, чем переплачивать за одну «жирную» карту. Считается не по бренду, а по **цена/задача**.
5. Но риски тоже есть: совместимость, охлаждение, отсутствие нормальных коннекторов, нестандартная сборка. То есть это не апгрейд “в лоб”, а инженерный костыль с хорошей экономикой.
Spend & Profit
@SpendProfitPro
**Дешёвый прирост VRAM: не всегда нужен топовый GPU**
Этот пост опубликован в Telegram-канале Spend & Profit. Подписаться можно по ссылке: @SpendProfitPro.