Ранг и цитирование AI — это не одно и то же число

Ввод одного и того же запроса в поле поиска и LLM дает два числа, которые выглядят сопоставимыми и не являются таковыми. Вот где это нарушает ваши репортажи.

<п>Разница в длине реальна и хорошо документирована: некоторые измерения, описывающие подсказки ChatGPT, выполняются на порядок дольше, чем типичный запрос Google по количеству символов. Ничто из этого не говорит вам, что делать в понедельник. Часть, которая должна изменить то, как вы читаете свои собственные отчеты, — это не длина ввода; это то, что две разные системы делают с одной и той же струной, когда вы начинаете измерять их обе одновременно.

Начинайте с операции, а не с количества слов

<п>Индекс поиска соответствует строке. Языковая модель интерпретирует один. Это разные задания, и они вознаграждают за разные формы ввода, поэтому подача одного и того же запроса на обе поверхности не дает вам двух прочтений одного и того же. Это дает вам две разные вещи, которые имеют общее поле ввода. Индекс ищет документы, текст которых соответствует буквальным терминам, которые вы ему передали. Модель использует все, что вы ей передали, для триангуляции намерения, и чем больше контекста она получает, тем увереннее она приближается к ответу. Дайте поисковому индексу длинную конкретную фразу, и вы сократите число конкурирующих документов, что обычно облегчает ранжирование. Дайте модели ту же фразу, и вы отточите ее цель. Та же строка, противоположная механика.

<п>Две мысли помогут сохранить честность, прежде чем мы пойдем дальше. Во-первых, длинная фраза не является автоматически длинным ключевым словом. Область SEO устоялась много лет назад, и самые опытные специалисты до сих пор прямо заявляют, что длинный хвост определяется спецификой и объемом поиска, а не количеством слов, поэтому главный термин из трех слов может быть жестко конкурентоспособным, в то время как номер модели продукта из пяти слов остается широко открытым. Второе исправление более глубокое, потому что длинная подсказка часто даже не является тем, что достигает индекса поиска, и часто не тем индексом, на котором построен ваш отчет о рейтинге. Со своей стороны, модели разбивают подсказку на более короткие поисковые запросы и запускают несколько из них: анализ потока кликов показывает, что набранная подсказка содержит около 23 слов, а поиск, который модель отправляет, ближе к четырем, а отдельное исследование измеряет более двух таких поисковых запросов на подсказку примерно по пять слов каждый. Длинное приглашение, которое вы набрали, и короткий запрос, отправленный моделью для сопоставления, не являются одним и тем же событием, поэтому рассмотрение длины приглашения как прокси для поведения поиска дважды приводит к неправильному механизму.

<п>Посмотрите внимательно, как это разложение влияет на ваше отслеживание, поскольку оно устраняет предположения. Что касается поиска, отправляемая вами строка — это строка, которая находит совпадение, поэтому, когда вы отслеживаете запрос, вы отслеживаете то, что ВЫ выбрали. Что касается ИИ, модель читает ваше приглашение, делает вывод, что вы имели в виду, и записывает свои собственные поисковые запросы для поиска поддержки. Это означает, что строка, которая касается индекса, является строкой, созданной МОДЕЛЬЮ, а не той, которую сделали вы или ваш клиент. Вы больше не отслеживаете свой запрос. Вы отслеживаете перефраз вашего запроса, заданный моделью, сравниваете его с индексом, а затем фильтруете обратно через собственное суждение модели о том, что заслуживает цитирования. Между записанным вами приглашением и результатом, который вы получили, находятся три преобразования, и ни одно из них не видно в числе, которое появляется на приборной панели.

Два конца кривой ведут себя по-разному

<п>Запрос, состоящий из одного слова, разрушает обе поверхности, причем по противоположным причинам. Модель LLM не может надежно триангулировать намерение по одному слову, поэтому она возвращает что-то общее, о чем бизнес не узнает. Традиционный поисковый индекс создает такую большую конкуренцию за главный термин, что бизнес почти наверняка не будет ранжироваться. Таким образом, короткий запрос читается как нецитированный и неранжированный одновременно, двойное отрицание, которое выглядит как ошибка, но на самом деле является слишком тонким вводом, чтобы что-либо диагностировать. Идите в дальний конец, и поверхности разделятся. Длинная конкретная фраза придает модели LLM богатый смысл и правдоподобную причину для цитирования, и одновременно дает традиционному поисковому индексу строку с низкой конкуренцией, по которой легче ранжироваться даже при скромном авторитете домена. Длинный конец можно читать как цитируемый, ранжированный или и то, и другое.

<п>Давайте рассмотрим пример: два конкурента продают одно и то же программное обеспечение B2B и на самом деле имеют почти идентичное представление о теме, которая важна для обоих. Одна команда строит свою систему отслеживания так, как она всегда записывала ключевые слова в сжатые именные фразы. Другая команда, новичок в этом деле, записывает свои отслеживаемые запросы так же, как и чат-бот, — полными вопросами. Набор первой команды склоняется к струнам в форме головы, которые яростно оспариваются в индексе и слишком тонкие, чтобы модель могла их разместить с какой-либо уверенностью, поэтому их приборная панель читается слабо с обеих сторон. Набор второй команды смещен в сторону длинных, конкретных вопросов, которые легко ранжируются при низкой конкуренции и дают модели достаточно поводов для цитирования, поэтому их информационная панель читается хорошо с обеих сторон. Ничто в их фактическом положении не отличается. Единственное, что отличается, это то, как каждая команда печатала, и в отчете стилистическая привычка незаметно превратилась в то, что выглядит как конкурентное преимущество.

Когда это становится проблемой измерения, а не языка

<п>Большинство ваших клиентов привыкают к одной фразеологической привычке, не задумываясь об этом, и так и будет, потому что люди идут по пути наименьшего сопротивления. Один клиент записывает запросы, которые он отслеживает, в виде кратких существительных, похожих на ключевые слова, другой пишет их как полноценные разговорные вопросы, и эта привычка не остается вежливо на ранжированной стороне отчета. Он сгибает обе колонны одновременно и сгибает их по-разному, поскольку каждая поверхность читает одну и ту же строку на своих собственных условиях. Два клиента с одинаковой реальной видимостью могут публиковать противоположные профили: один с высоким рейтингом и слабым с цитированием, а другой наоборот, без всякой причины, кроме того, как каждый из них набрал текст. Это реальная проблема с достоверностью, и не только для ранга, прочитанного отдельно. Цифра выглядит как факт о клиенте. Частично это связано с формулировкой.

<п>Вот почему выстраивание ранжирования рядом с цитированием и чтение двух столбцов как сопоставимых является ошибкой. Вы сравниваете два числа, которые никогда не были числами одного и того же типа, потому что каждое из них было создано другой системой, выполняющей разную работу со строкой, которую она считывала на разных терминах. Исследование совпадения подтверждает наличие расхождений, даже несмотря на то, что они не могут прийти к единому мнению относительно их размера. Moz обнаружил, что большинство цитирований в режиме AI никогда не появляются в органических результатах по одному и тому же запросу, в одном исследовании по отслеживанию едва ли десятая часть цитируемых URL-адресов попала в топ-10 Google, а исследование Semrush показало другую тенденцию, по крайней мере, для одной платформы, причем Perplexity сильно перекрывает топ-10 Google. Величина оспаривается. Тот факт, что две поверхности считывают и вознаграждают разные вещи, не является таковым.

<п>Существует версия этого разрыва, которая сохраняется лучше, чем самостоятельный ранг, и я хочу быть осторожным с тем, как я ее выражаю, потому что это аргумент, а не доказанный результат. Разрыв между рейтингом и цитированием считывается с одной и той же строки запроса с обеих сторон, поэтому эффект формулировки, искажающий каждое абсолютное число, должен в значительной степени нивелироваться из сравнения, что сделает контраст более достоверным, чем любая цифра сама по себе. Это рассуждение, а не то, что кто-то продемонстрировал, и вам следует рассматривать это именно так. Что достаточно устойчиво, чтобы действовать, так это соседняя точка, эта входная форма перемещает то, что оказывается на поверхности. Контролируемая работа показала, что источники ИИ меняются в зависимости от характера запроса, а отдельное исследование показало, что результаты меняются, когда подсказки перефразируются. Форма — это переменная. Считать его постоянным при сравнении поверхностей — ошибка.

Защита представляет собой объемную колонку, и она работает только с одной стороны

Защита рядовых игроков непривлекательна, и в этом вся игра. Никогда не читайте номер ранга без рядом с ним объема поиска. Четвертое место в рейтинге по фразе, которую никто не ищет, не является победой; это фраза, которая получила рейтинг, потому что она была достаточно конкретной, чтобы оставаться неоспоримой, а объем — это то, что делает пустое размещение очевидным как пустое. Те же источники SEO, которые хвалят специфичность «длинного хвоста», предупреждают, что объем — это отправная точка, а не приговор. Самый здоровый на вид номер на приборной панели иногда оказывается самым пустым, и только громкость рядом с ним подскажет, какой именно.

<п>Эта дисциплина не переходит черту, и именно здесь большинство людей тайно обманывают. Объем поиска — это измерение поверхности поиска, производимое механизмом, не имеющим эквивалента на стороне LLM. Ни одна платформа не раскрывает, как часто задавался вопрос, не существует индекса частоты запросов, и все, что продается как объем запросов LLM, представляет собой данные поисковых ключевых слов в костюме или показатель цитирования, переименованный в спрос. Таким образом, установка цифры объема рядом с цитатой, чтобы оценить, имеет ли эта цитата значение, не является ограждением. Объём дисциплин ранжируется. Там ничего не говорится о цитате, и притворяться, что она простирается поперек, — это еще один случай рассмотрения двух поверхностей как одной.

<п>Возникает справедливый вопрос: если объем не передается, что дисциплинирует сторону цитирования? Не учитывается спрос, потому что его не существует, чтобы его можно было иметь. Честной заменой является частота цитирования в наборе подсказок, повторяющаяся с течением времени, что является сигналом направления, а не показателем объема, и его следует воспринимать как один. Он говорит вам, является ли ваше присутствие в ответе стабильным или случайным, а не о том, сколько людей задали вопрос. Относиться к такому направленному прочтению как к точному числу спроса — это версия той же ловушки пустого ранга со стороны цитирования, и это вызывает тот же скептицизм.

Читайте свои собственные инструменты

<п>Ничто из этого не дает повода отступать от цифр. Беспорядок реален, независимо от того, измеряете ли вы его или нет. Ответы ИИ меняются между запусками, каждая поверхность читает одну и ту же строку по-разному, а формулировка искажает сравнение. Измерение этого показателя не создает такой волатильности. Отсутствие измерения просто оставляет волатильность невидимой и позволяет вам принять одно показание за факт. Настоящая ошибка не в беспорядке. Он рассматривает одиночный прогон так, как если бы он был зафиксирован, считывая его сразу за один день как правду о вашей заметности. Данные в такой форме являются скорее направленными, чем прямыми, и направленность не является извинением; это правильная единица прямо сейчас. Позиция, за которой вы можете наблюдать, как она меняется с течением времени, разрыв, который вы можете измерить, тренд, выбранный на протяжении многих прогонов, а не просматриваемый сразу, – все это читабельно и честно в точности так, как не является оценка по одной точке, претендующая на точность. Инструмент должен соответствовать рельефу местности, а рельеф местности, который смещается, считывается по направлению, а не по десятичной дроби.

Все это сводится к единственному прочному навыку в комнате. Уровень измерения в поиске ИИ достаточно молод, чтобы цифры выглядели более точными, чем они есть на самом деле, и практик, который понимает, что система сделала с входными данными, — это тот, кто может отличить реальный сигнал от артефакта формулировки. Ни один инструмент не установит это суждение за вас. Что-то может выявить разрыв между рейтингом и цитируемостью; понимание того, почему этот разрыв является сигналом, а не шумом, вам предстоит нести.

Подводя итоги этой недели, имейте в виду, что SEO — это не GEO, а GEO — это не SEO, и хотя они дополняют друг друга, они разные. Одну из них вы, вероятно, освоили десять лет назад. Другой требует новых навыков, нового словарного запаса, новых данных и нового отчета о том, что машина делает с вашим вводом между подсказкой и ответом. Заверение в том, что хорошее SEO — это все, что вам нужно, — это направление, призванное обеспечить вам комфорт, которое часто можно услышать от тех, кому есть что терять. Поверхности по-прежнему расходятся, и объединить их — самое дорогое, что вы можете привнести в эту работу.

Если вы заметили этот коллапс, скрывающийся где-то в вашем собственном стеке, или вы видите, что асимметрия кусается так, как я не учел, я хочу услышать это в комментариях. А если вам нужна более длинная версия аргумента в пользу того, почему понимание машинного уровня важнее погони за его результатами, вот моя книга: The Machine Layer.

Этот пост был первоначально опубликован на сайте Duane Forrester Decodes.