Anthropic выкатили Claude Fable 5. Громкий релиз: 80,3% на SWE-bench Pro, миграция кодбазы Stripe за день, «самая мощная публичная модель».
Но бенчмарки — это чужая кухня. Интереснее другое: может ли модель собрать не кусок кода, а продукт целиком.
Проверка была простая:
— один промпт
— браузерная игра
— без ТЗ на 10 страниц
— без ручной сборки механик
Что получилось: симулятор админа Telegram-канала про ИИ. С интерфейсом, балансом, ветками и концовками. И да, играть можно даже с телефона 📱
Вывод практический:
модель уже умеет не только генерить код, но и склеивать MVP из идеи, механики и UI. Это полезно не для хайпа, а для быстрой проверки гипотез: лендинг, мини-игра, прототип, квиз.
Но важно: на уровне продакшена это всё ещё не «поставил и забыл». Логика, баланс и баги всё равно требуют ручной проверки. Иначе получится не продукт, а демка с красивым лицом.
Директ Разбор
@DirectRazborPro
Anthropic выкатили Claude Fable 5. Громкий релиз: 80,3% на SWE-bench Pro, миграция кодбазы Stripe за день, «са
Этот пост опубликован в Telegram-канале Директ Разбор. Подписаться можно по ссылке: @DirectRazborPro.