<b>AI-отделы CPA опять будут мериться SFT: EKSFT пришёл за бедными датасетами</b>

01 June 2026, 15:57 Оригинал в Telegram →

<b>AI-отделы CPA опять будут мериться SFT: EKSFT пришёл за бедными датасетами</b>

Авторы предложили EKSFT — selective fine-tuning для LLM на малых данных: метод маскирует токены с высокой энтропией или высоким KL-расхождением от reference model. На math reasoning benchmark он стабильно обошёл обычный SFT, а после RL дал лучшее качество. Код и датасеты уже выложены на GitHub.

Для CPA это не академический фетиш, а новый повод дёрнуть ML-ребят за рукав. Если у вас LLM-пайплайн для прелендов, UGC-скриптов, саппорта или креативных пачек — завтра можно попросить сравнить обычный SFT против EKSFT на ваших 500–2000 примерах.

И да, теперь фраза «нам просто нужен датасет побольше» звучит чуть менее убедительно. Очень неудобно для тех, кто три месяца пил бюджет на разметку.

Источники:

arxiv.org

Этот пост опубликован в Telegram-канале CPA Paparazzi — светская хроника арбитража. Подписаться можно по ссылке: @cpa_after_hours.

Готовы запустить рекламу через сеть public.tg?