<b>Qwen2.5-1B-Instruct прибавил 51% — prompt-гуру в командах напряглись</b>
В arXiv-выложенной работе предложили MIPO: модель делает “плюс” на правильном prompt и “минус” на случайном чужом prompt, дальше это скармливают через DPO. На Llama и Qwen 1–7B получили 3–16% прироста персонализации, а Qwen2.5-1B-Instruct — +51%.
Для CPA-команд это неприятный намёк: часть магии “у нас есть свой AI-отдел” снова оказывается не в гениальном промпте, а в нормальной сборке пар для обучения. Крео-генераторы, скрипты для саппорта, автоответы под GEO — завтра можно дать AI-лиду тест на MIPO вместо очередной презентации про “уникальный пайплайн”.
Кто первым продаст это как внутренний секретный AI-мозг за x3 к зарплате?
CPA Paparazzi — светская хроника арбитража
@cpa_after_hours
<b>Qwen2.5-1B-Instruct прибавил 51% — prompt-гуру в командах напряглись</b>
Источники:
Этот пост опубликован в Telegram-канале CPA Paparazzi — светская хроника арбитража. Подписаться можно по ссылке: @cpa_after_hours.