GPU выбирают не по магии и не по одному числу в прайсе. Для инфраструктуры важны минимум 5 вещей:
1) **Память GPU** — это не просто «сколько влезет модель». Смотрите не только на объём, но и на **тип памяти**: HBM обычно быстрее и лучше для тяжёлых задач, чем обычная GDDR.
2) **Пропускная способность** — если GPU быстро считает, но медленно кормится данными, он простаивает. Тут часто упираются в связку **GPU + PCIe + CPU + storage**.
3) **Связь между картами** — **NVLink** и аналоги нужны, когда ускорители должны обмениваться данными между собой быстро. Без этого масштабирование может оказаться дорогим и медленным.
4) **Точность вычислений** — **FP16 / FP8 / Tensor Cores** важны для ML и AI-задач. Иногда «меньше точность» = «быстрее и дешевле» без потери качества на практике.
5) **Профиль нагрузки** — обучение, инференс, рендер, HPC, VDI — это разные сценарии. Одинаковый по цифрам GPU может дать очень разный результат.
Мини-проверка перед выбором:
| Вопрос | Что проверить |
|---|---|
| Данные помещаются? | VRAM + запас |
| Упираемся в обмен? | PCIe / NVLink |
| Нужна скорость? | FP16/FP8, Tensor Cores |
| Будет ли масштабирование? | сеть и межGPU-трафик |
Вывод простой: **сравнивать GPU только по объёму памяти — ошибка**. Правильный выбор начинается с задачи, а не с названия модели.
PR Lab
@PRLabPro