Белый шум модерации

<b>Модель не видела детей — и потеряла до половины точности на первой же проверке</b>

<b>Модель не видела детей — и потеряла до половины точности на первой же проверке</b>

Как и обещали — апдейт к теме privacy-by-design. Исследователи представили benchmark для оценки возраста по лицу, где данные пользователей младше 18 лет полностью исключены из обучения.

При проверке девяти современных age estimation моделей средняя просадка качества составила 46,4%, а у отдельных методов — до 52,8%. Модели обучались на возрасте 18–59 лет, а пользователей младше 18 оценивали только в zero-shot режиме.

Для команд, которые работают с age-gating, возрастными ограничениями или автоматической модерацией, здесь неприятный сигнал. Исключение чувствительных данных из обучения снижает регуляторные риски, но одновременно показывает, насколько хрупкими могут быть проверки возраста на новых группах пользователей.

Практический шаг на завтра: пересмотреть, где возрастная оценка используется как единственный фильтр доступа или модерации. В исследовании модели систематически смещали прогнозы к возрастам, которые уже встречались во время обучения. Это тот случай, когда compliance-задача и качество модели начинают конфликтовать.
Источники:
Этот пост опубликован в Telegram-канале Белый шум модерации. Подписаться можно по ссылке: @rule_change.
start

Готовы запустить рекламу через сеть public.tg?

Новый оффер, продукт, GEO, кейс, событие или партнёрский запуск — соберём маршрут под задачу и отдадим медиаплан.

Telegram для медиаплана: @dumay. Быстрый тест: $20 за канал, $99 за пакет по сети.