<b>AI-отделы CPA опять будут мериться SFT: EKSFT пришёл за бедными датасетами</b>
Авторы предложили EKSFT — selective fine-tuning для LLM на малых данных: метод маскирует токены с высокой энтропией или высоким KL-расхождением от reference model. На math reasoning benchmark он стабильно обошёл обычный SFT, а после RL дал лучшее качество. Код и датасеты уже выложены на GitHub.
Для CPA это не академический фетиш, а новый повод дёрнуть ML-ребят за рукав. Если у вас LLM-пайплайн для прелендов, UGC-скриптов, саппорта или креативных пачек — завтра можно попросить сравнить обычный SFT против EKSFT на ваших 500–2000 примерах.
И да, теперь фраза «нам просто нужен датасет побольше» звучит чуть менее убедительно. Очень неудобно для тех, кто три месяца пил бюджет на разметку.
CPA Paparazzi — светская хроника арбитража
@cpa_after_hours
<b>AI-отделы CPA опять будут мериться SFT: EKSFT пришёл за бедными датасетами</b>
Источники:
Этот пост опубликован в Telegram-канале CPA Paparazzi — светская хроника арбитража. Подписаться можно по ссылке: @cpa_after_hours.