Белый шум модерации

OpenAI: риск использования LLM в дезинформационных кампаниях

OpenAI: риск использования LLM в дезинформационных кампаниях

Факт: исследователи OpenAI совместно с Georgetown University’s Center for Security and Emerging Technology и Stanford Internet Observatory изучили, как большие языковые модели могут использоваться для дезинформационных целей.

В работе также был октябрьский воркшоп 2021 года: 30 исследователей дезинформации, ML-экспертов и policy-аналитиков. Итогом стал совместный отчет на базе более чем года исследований.

Что задето:
— платформы с UGC и рекламными кабинетами;
— команды модерации контента;
— trust & safety и compliance-процессы;
— кампании, где важны репутационные и policy-риски.

Риск: отчет описывает угрозы для информационной среды, если языковые модели используются для усиления дезинформационных кампаний. Отдельно введена рамка для анализа возможных мер снижения риска.

Что делать: читать такие документы как early warning для модерации и brand safety. Проверять, где в ваших процессах есть массовая генерация текстов, слабая проверка источников и зависимость от автоматического контента без ручного контроля.
Источники:
Этот пост опубликован в Telegram-канале Белый шум модерации. Подписаться можно по ссылке: @rule_change.
start

Готовы запустить рекламу через сеть public.tg?

Новый оффер, продукт, GEO, кейс, событие или партнёрский запуск — соберём маршрут под задачу и отдадим медиаплан.

Telegram для медиаплана: @dumay. Быстрый тест: $20 за канал, $99 за пакет по сети.