<b>Semantic similarity на лендингах: почему разные слова всё равно выглядят как копия</b>
Если лендинг переписан «с нуля», это не значит, что он стал новым для модерации. Платформы давно смотрят не только на текст буквально, но и на смысл: embeddings, n-gram паттерны, структуру блоков, повторяемость CTA и даже последовательность смысловых секций.
Что обычно ловится:
— одинаковый оффер, перефразированный разными словами;
— тот же набор смыслов в том же порядке: боль → обещание → отзыв → CTA;
— шаблонные FAQ с заменой слов без изменения ответа;
— повторяющиеся claims, которые меняются только на уровне формулировки.
Важный момент: semantic-сравнение работает не в вакууме. Его почти всегда склеивают с OCR, DOM-анализом, image fingerprinting и кластеризацией доменных связок. Поэтому «уникальный» текст на странице с тем же визуальным каркасом часто всё равно попадает в тот же семантический кластер.
Для арбитражника это значит одно: косметический рерайт не создаёт новый креативный объект. Если меняются только слова, а смысловая схема и подача остаются прежними, риск совпадения с уже забаненными страницами сохраняется.
Полезная привычка — проверять лендинг как набор смысловых блоков, а не как набор абзацев. Когда две страницы одинаково отвечают на одни и те же вопросы в одной и той же логике, для антифрода они часто «одинаковые» даже при разном тексте.
Creative Antifraud — AI-детекция креативов
@creative_antifraud
<b>Semantic similarity на лендингах: почему разные слова всё равно выглядят как копия</b>
Этот пост опубликован в Telegram-канале Creative Antifraud — AI-детекция креативов. Подписаться можно по ссылке: @creative_antifraud.