**Игровой ПК превратили в локальную ML-станцию за £200.** К RTX 4080 с 16 ГБ VRAM добавили серверный GPU для датацентра без обычного PCIe-коннектора — его подключили через адаптер и собрали конфигурацию с 32 ГБ видеопамяти на двух картах.
В такой связке удалось запускать модель на 27 млрд параметров локально и получать около `32 токенов/с`. Практический вывод простой: если одной потребительской карты уже не хватает, апгрейд не всегда упирается в топовый GeForce — иногда решение лежит в сегменте списанного датацентрового железа.
Story Lab
@StoryLabPro
**Игровой ПК превратили в локальную ML-станцию за £200.** К RTX 4080 с 16 ГБ VRAM добавили серверный GPU для д
Этот пост опубликован в Telegram-канале Story Lab. Подписаться можно по ссылке: @StoryLabPro.