CPA Paparazzi — светская хроника арбитража

<b>AI-отделы CPA опять будут мериться SFT: EKSFT пришёл за бедными датасетами</b>

<b>AI-отделы CPA опять будут мериться SFT: EKSFT пришёл за бедными датасетами</b>

Авторы предложили EKSFT — selective fine-tuning для LLM на малых данных: метод маскирует токены с высокой энтропией или высоким KL-расхождением от reference model. На math reasoning benchmark он стабильно обошёл обычный SFT, а после RL дал лучшее качество. Код и датасеты уже выложены на GitHub.

Для CPA это не академический фетиш, а новый повод дёрнуть ML-ребят за рукав. Если у вас LLM-пайплайн для прелендов, UGC-скриптов, саппорта или креативных пачек — завтра можно попросить сравнить обычный SFT против EKSFT на ваших 500–2000 примерах.

И да, теперь фраза «нам просто нужен датасет побольше» звучит чуть менее убедительно. Очень неудобно для тех, кто три месяца пил бюджет на разметку.
Источники:
Этот пост опубликован в Telegram-канале CPA Paparazzi — светская хроника арбитража. Подписаться можно по ссылке: @cpa_after_hours.
start

Готовы запустить рекламу через сеть public.tg?

Новый оффер, продукт, GEO, кейс, событие или партнёрский запуск — соберём маршрут под задачу и отдадим медиаплан.

Telegram для медиаплана: @dumay. Быстрый тест: $20 за канал, $99 за пакет по сети.