Я уважаю любой инструмент, который не заканчивается на «сгенерируй мне кнопку». Поэтому тесты в духе «сделай змейку» мне мало что говорят. В работе важнее другое: может ли модель собрать не кусок, а целый рабочий контур.
Здесь эксперимент был уже ближе к реальности: одним промптом попросили Claude Fable 5 собрать браузерную игру про админа Telegram-канала об ИИ. Не макет, не демку ради демки, а продукт с логикой, балансом, интерфейсом и концовками. Получился «Нейровестник» — симулятор, который можно открыть даже с телефона.
Что мне в этом интересно как практику: модель уже не просто пишет код, она начинает тянуть на себя сборку процесса. Это похоже на хорошую смену на складе: если человек понимает порядок операций, меньше шансов, что приемка, маркировка и отгрузка развалятся на стыках. Тут ровно тот же смысл — не отдельная функция, а связанная система.
И да, если модель сама вшила в баланс мораль, это уже не игрушка про ИИ. Это напоминание, что у любого удобного инструмента есть цена на косяки.
Logi Room
@LogiRoomPro
Я уважаю любой инструмент, который не заканчивается на «сгенерируй мне кнопку». Поэтому тесты в духе «сделай з
Этот пост опубликован в Telegram-канале Logi Room. Подписаться можно по ссылке: @LogiRoomPro.