<b>Vercel добавил Nemotron 3 Ultra: 1M токенов и до 350 tps для агентных цепочек</b>
Nemotron 3 Ultra от Nvidia теперь доступен в Vercel AI Gateway. Это open Mixture-of-Experts reasoning model для долгих agent workflows: planning, tool use, sub-agent delegation и error recovery. Контекст — до 1M токенов, throughput — до 350 tokens/sec, на agentic tasks обещают до 30% lower cost.
Для команд на Vercel это не просто ещё одна модель в списке. Если у вас есть multi-turn агенты, длинные цепочки с инструментами или разбор больших документов, теперь можно проверить, упрётся ли пайплайн в качество или в экономику.
В AI SDK модель подключается как <code>nvidia/nemotron-3-ultra-550b-a55b</code>.
Dev Services Radar — SaaS для разработчиков
@dev_services_radar
<b>Vercel добавил Nemotron 3 Ultra: 1M токенов и до 350 tps для агентных цепочек</b>
Источники:
Этот пост опубликован в Telegram-канале Dev Services Radar — SaaS для разработчиков. Подписаться можно по ссылке: @dev_services_radar.