<b>Qwen2.5-1B-Instruct прибавил 51% — prompt-гуру в командах напряглись</b>

30 May 2026, 15:02 Оригинал в Telegram →

<b>Qwen2.5-1B-Instruct прибавил 51% — prompt-гуру в командах напряглись</b>

В arXiv-выложенной работе предложили MIPO: модель делает “плюс” на правильном prompt и “минус” на случайном чужом prompt, дальше это скармливают через DPO. На Llama и Qwen 1–7B получили 3–16% прироста персонализации, а Qwen2.5-1B-Instruct — +51%.

Для CPA-команд это неприятный намёк: часть магии “у нас есть свой AI-отдел” снова оказывается не в гениальном промпте, а в нормальной сборке пар для обучения. Крео-генераторы, скрипты для саппорта, автоответы под GEO — завтра можно дать AI-лиду тест на MIPO вместо очередной презентации про “уникальный пайплайн”.

Кто первым продаст это как внутренний секретный AI-мозг за x3 к зарплате?

Источники:

arxiv.org

Этот пост опубликован в Telegram-канале CPA Paparazzi — светская хроника арбитража. Подписаться можно по ссылке: @cpa_after_hours.

Готовы запустить рекламу через сеть public.tg?