<b>Старые градиенты больше не мусор: CoCD обещает O(1) запрос на шаг</b>
В arXiv:2605.14373v3 авторы предложили Coherent Coordinate Descent — deterministic, sample-efficient, budget-aware zeroth-order optimizer. CoCD формализует gradient coherence и сводится к BCCD с warm starts.
Фишка нервная: исторические stale gradients тут не выбрасывают, а превращают в актив. На MLP, CNN и ResNet до 270k параметров CoCD обошёл BCCD по sample efficiency и convergence loss/accuracy, плюс был стабильнее randomized ZO methods.
Для CPA-команд с in-house ML это не красивая математика на полку. Завтра можно дать dev/ML человеку одну задачу: прогнать CoCD против BCCD на лёгкой модели ранжирования креативов или лендингов. И посмотреть, где реально меньше запросов, меньше дрожи, меньше ночных «почему опять всё поплыло».
Старый градиент вернулся в чат. И теперь он не виноватый, а полезный.
Drama CPA — сериал индустрии
@drama_cpa_pub
<b>Старые градиенты больше не мусор: CoCD обещает O(1) запрос на шаг</b>
Источники:
Этот пост опубликован в Telegram-канале Drama CPA — сериал индустрии. Подписаться можно по ссылке: @drama_cpa_pub.