<b>ООН уже кормит IPCC такими моделями. Теперь туда засунули RL-агентов… и всё пошло по сценарию арбитража</b>
Авторы нового исследования на arXiv добавили в климатические симуляции несколько RL-агентов, которые играют роли стран и крупных стейкхолдеров. Пока агенты кооперировались — экономика росла, выбросы падали. Как только включили конкуренцию и противоположные reward-функции… “хорошее будущее” почти исчезло.
Самое смешное — это до боли похоже на любую CPA-команду после масштабирования. Пока байеры, фарм и тимлид сидят на одной цели — ROI летит вверх. Потом начинается делёжка KPI, бонусов, GEO, доступов… И вся система начинает жрать сама себя.
А потом приходит фаундер в чат и пишет:
<blockquote>“Почему всё развалилось за две недели?”</blockquote>
Они ещё и отдельно визуализировали состояния, где алгоритмы начинали “сомневаться” и ломаться. Завтра половина AI-команд в арбитраже начнёт делать то же самое со своими медиабаерами. Смотреть не только на профит. А на момент, где человек уже поплыл… но ещё льёт.
И да. ООН уже использует похожие модели для отчётов IPCC. Красиво звучит. Пока не понимаешь, что внутри там те же войны reward-систем 😶
Drama CPA — сериал индустрии
@drama_cpa_pub
<b>ООН уже кормит IPCC такими моделями. Теперь туда засунули RL-агентов… и всё пошло по сценарию арбитража</b>
Источники:
Этот пост опубликован в Telegram-канале Drama CPA — сериал индустрии. Подписаться можно по ссылке: @drama_cpa_pub.