- Google пояснил, что его политика в отношении спама распространяется на попытки манипулировать ответами ИИ в Поиске. ли>
- Июньское обновление по борьбе со спамом распространяется в соответствии с существующей политикой. ли>
- В статье Корнеллского технологического института говорится, что один оставленный комментарий может изменить то, что рекомендует ИИ. ли> мл>
Политика Google в отношении спама теперь распространяется на попытки манипулировать ответами ИИ в Поиске. В статье Корнеллского технологического института показано, почему сложно обеспечить соблюдение этого принципа.
Google начал выпуск июньского обновления о спаме, второго за год. Он обеспечивает соблюдение документированной политики в отношении спама, и одна из этих политик теперь охватывает больше вопросов, чем раньше.
Правила Google в отношении спама относятся к попыткам «манипулировать генеративными ответами ИИ»; в Поиске как нарушение, и это одна из политик, которые применяет обновление.
<стр>Препринт Cornell Tech, опубликованный 404 Media, объясняет, почему эту политику труднее обеспечить, чем предполагает ее формулировка. Страницы сообщества, на которые опираются агенты по исследованию ИИ, также могут содержать комментарии третьих лиц, а комментарий может содержать рекомендацию, которую автор никогда не писал.
<п>Таким образом, то, что Google называет спамом, передается через тот самый поиск, на который полагаются эти агенты. Исследования показывают, что все очевидные меры защиты имеют свои недостатки.
<стр>Всем, кто пытается подтолкнуть бренд к ответам, генерируемым ИИ, знайте, что грань между оптимизацией и спамом стирается.стр>
Ставки
По мере увеличения количества упоминаний, указывающих на Google, и меньшего количества упоминаний о внешних веб-сайтах, тяга к их созданию соответственно возрастает.
<стр>Серый рынок уже начал формироваться, и авторы Корнелла отмечают, что маркетологи заняты тестированием способов подтолкнуть к ответам, генерируемым ИИ.стр> <п>Между тем у предприятий нет данных, необходимых для того, чтобы увидеть, что происходит. Как говорилось в нашем предыдущем обзоре агентного поиска, ни одна панель мониторинга не сообщает сайту, попал ли он в ответ ИИ, был ли он процитирован в сгенерированном отчете или был пропущен.
В результате получается нарушение, которое Google может назвать, но вовлеченный сайт часто не видит.
Что обнаружили исследования
<стр>Документ под названием «Агенты глубоких исследований можно отравить через пользовательский контент» который не прошел рецензирование, исследует слабое место в том, как исследовательские инструменты ИИ собирают свои источники. Эти инструменты отвечают на вопрос, запуская серию связанных подзапросов, захватывая страницы, которые постоянно попадают на них, и собирая отчет с цитатами.
<п>Анализ показал, что одни и те же страницы сообщества неоднократно появлялись в этих подзапросах. Внутри одного тематического кластера одна страница, созданная пользователем, появлялась в 48% запросов, а платформы, созданные пользователями, составляли от 17% до 23% каждого полученного URL-адреса. Измените одну из этих повторяющихся страниц, и это изменение может отразиться на отчетах по всей теме.
Авторы обнаружили, что примерно 13 слов подброшенного текста на повторяющейся странице было достаточно, чтобы вставить выбранный злоумышленником объект в готовый отчет в 38–51% сеансов, в которых была получена страница.
<п>Разбросав один и тот же текст по нескольким страницам, эта цифра выросла до 42–62%. Даже скрытый внутри полной страницы, где он составлял менее 4% от того, что прочитал агент, подброшенный текст все равно всплывал в 30–53% сеансов.
Три теста с открытым исходным кодом прошли тесты: STORM, Co-STORM и OmniThink, все они проводились в симуляции, так что ничего в живой сети не было затронуто.
Там, где сложно добиться соблюдения закона
Google может пометить манипуляции с ответами ИИ как спам и действовать в зависимости от того, что он улавливает. Поймать его — самое сложное. Подброшенный текст читается как настоящий совет и находится на тех же страницах, которые всегда собирались читать инструменты, поэтому основная проблема — отличить его от обычного поста.
<п>Исследовательская группа искала защиту от подброшенного текста, но не нашла ее. Они пытались исключить источники, созданные пользователями, проверить их с помощью языковой модели перед использованием и прочесать готовый отчет на предмет утверждений, которые не подтвердились.
Ни один из трёх не остановил атаку, не ухудшив при этом результаты для пользователя. Отбросьте источники, созданные пользователями, и вы потеряете детали сообщества, которые делают инструменты поиска ИИ достойными использования.
Инструменты, которыми пользуется большинство людей, не входят в этот тест. ChatGPT Deep Research и Gemini Deep Research проводят поиск, который исследователи не могли отравить, не переступив этическую черту, поэтому они измеряли только привычки цитирования. Gemini полагались на пользовательский контент в 12,1% случаев, что авторы называют намеком на воздействие, а не проверенным результатом. Инструмент OpenAI достиг этого гораздо меньше.
Почему это важно для специалистов по поиску
<п>Действия, которые могут помочь бренду привлечь внимание к ответам ИИ, аналогичны тактике манипуляции, которую Google называет «спамом». например, размещение упоминаний на сайтах, которые читаются этими инструментами. Мы не знаем, где находится грань Google между получением упоминания и инженерной поддержкой.
Для электронной коммерции и местных брендов опасность исходит с другой стороны.
<п>Тестовые случаи представляли собой обычные вопросы, которые люди задают, например, в какую службу позвонить, какой продукт купить и где поесть. Конкурент или мошенник может подставить незнакомое имя в эти ответы рядом с законными вариантами, и вытесняемый бренд никогда об этом не узнает.стр>
Для издателей новостей и более крупных брендов беспокойство вызывает доверие к ответу, на который попадает их имя. Цитата из инструмента искусственного интеллекта рассматривается как победа, но цитирование отражает только то, что вытащил инструмент, а не то, была ли эта страница правильной, и ответ может определяться контентом, который бренд никогда не писал.
Все это нельзя исправить. Видимость ИИ стала поверхностью, которую вы активно контролируете, а не просто каналом, для которого вы пассивно оптимизируете.
<ч2>Взгляд в будущееч2>
Авторы назвали пользовательские манипуляции открытой проблемой, которую ни одна платформа не может решить самостоятельно. Reddit отметил свою давнюю борьбу с скоординированными манипуляциями, а Google прикрепил контекстные метки к некоторым материалам из Reddit в обзорах AI. Ни один из них не затрагивает концентрацию извлечения, на которую указывает статья.
Google не указал, как он намерен обеспечить соблюдение манипуляций с генеративным искусственным интеллектом, будь то с помощью специального обновления или с помощью системы SpamBrain и ручных проверок, на которые он опирается в большинстве случаев нарушений.
На данный момент политика называет поведение выходящим за рамки, и проверка ответов ИИ по-прежнему остается за тем, кто их читает.
