Вся суть была в беспорядке

LLM специально читают неструктурированный язык. Учебник GEO/AEO — это лучшие практики SEO, переизданные как новинки.

Semrush на прошлой неделе опубликовал инфографику. Такой, который создан для создания скриншотов в каруселях LinkedIn и вставки в колоды вебинаров. Четыре столпа. Четвертый называется «Техническая ГЕО»: схема, структурированные данные, чистая архитектура. Строка, которая это оправдывает: “Гарантирует, что механизмы искусственного интеллекта смогут анализировать и связывать ваш контент”

Гарантирует.

<п>

Смотрите прямую трансляцию на X/Twitter. Изображение предоставлено: Педро Диас

Вот вся пьеса одним словом. Архитектура больших языковых моделей по своей конструкции противоположна архитектуре обеспечения. И схема не имеет никакого отношения к тому, может ли LLM анализировать текст. LLM анализируют текст, читая текст.

<п>Семраш далеко не одинок. Каждый поставщик SaaS, имеющий скин в этой игре, использует варианты одной и той же игры. Управляемость эпохи SEO, переименованная в новую аббревиатуру. Те же проценты, столпы и пирамиды. Все одеты для системы, которая была создана специально для того, чтобы не работать таким образом.

Я уже приводил стратегическую версию этого случая в главе «Ваша стратегия ИИ — это не стратегия». Эта часть представляет собой технический этаж под ней.

Создан, чтобы читать всё, что там есть

Языковые модели существуют потому, что в сети беспорядок. Форумы, заглушки Википедии, сообщения в блогах, написанные в 2 часа ночи, скопированные копии продуктов, машинный перевод мусора, комментарии к коду, неполные предложения, опечатки, противоречия — все, от журнальной статьи до дерьмового поста на сабреддите. Данные перед обучением — это публичная сеть, а публичная сеть никогда не была структурирована.

<п>Архитектура преобразователя решает эту проблему, рассматривая язык как последовательность токенов. Внутри модели нет анализатора, который ищет <schema> теги. Разметка FAQ не имеет предпочтений. Модель читает слова. Таков механизм.

Во время вывода модель генерирует больше токенов, обусловленных входными данными. Ни один из этих конвейеров не читает микроданные.

Schema.org предлагает настоящую работу. Он предоставляет богатые результаты в классическом поиске. Он поддерживает устранение неоднозначности сущностей в графе знаний. Это помогает голосовым помощникам извлекать структурированные поля. Это четко определенные функции внутри конкретных систем. Они не являются механизмом, с помощью которого LLM понимает предложение.

<п>Поэтому, когда поставщик заявляет, что структурированные данные «гарантируют, что механизмы искусственного интеллекта смогут анализировать и связывать ваш контент», нечего гарантировать. Уровень синтаксического анализа, который они себе представляют, отсутствует. Модель уже анализирует ваше предложение. Он сделал это, прочитав предложение.

Один трюк, три фирменных цвета

Посмотрите на крупнейшие объяснительные материалы по GEO и AEO, представленные на рынке прямо сейчас, и вы обнаружите ту же книгу времен SEO, только с поменянной аббревиатурой.

Семраш уже рассмотрен. Четвертый столп его “Technical GEO” представляет схему и структурированные данные как гарантию того, что архитектура не может обеспечить.

<п>AirOps опубликовала рисунок под названием «15 способов получить цитирование от ChatGPT, Perplexity и & Google». Это самый насыщенный цифрами образец жанра, который я видел в этом году. Разметка Schema увеличивает вероятность цитирования на 13%. Последовательные теги H2–H4 удваивают ваши шансы. Короткие абзацы повышают вероятность появления контента в ответах ИИ на 49%. Perplexity упоминает UGC в 91% ответов по сравнению с 7 у Gemini. Прочтите примечания к источнику, и методология придет к вам. Цифры на графике соответствуют собственному «Отчету о состоянии искусственного интеллекта за 2026 год» AirOps. AirOps цитирует AirOps в вопросе, работают ли рецепты AirOps.

<п>Peec AI местами работает более честно. В его полном руководстве по GEO признается вероятностная природа системы и признается, что базовые модели уже обучены, поэтому оптимизация фокусируется на уровне поиска. Затем он дает те же рекомендации: иерархия заголовков, маркированные списки, разметка часто задаваемых вопросов, несколько типов схем, расположенных на каждой странице, резюме вверху разделов – все они построены на утверждении о том, что длинные абзацы проигрывают, потому что движок извлекает фрагменты, а не полные статьи.

Profound, цитируя контрольный список Алейды Солис, является наиболее откровенным в своей статье: «Оптимизация для извлечения на уровне фрагментов». Каждый раздел — отдельный фрагмент. Каждая страница — шведский стол, из которого движок берет то, что хочет. Паровоз в этом рассказе — вежливый гость, который берет только то, что выложили.

<п>Три продавца. То же рабочее предположение: контролируемая, предписывающая техническая дисциплина находится между издателем и цитированием и имеет примерно ту же форму, что и классическое SEO. Схема, заголовки, структура, актуальность, машиночитаемые форматы. Семья. Оплачивается. Подчиняется директору по маркетингу.

Что на самом деле делает схема

<п>Схема здесь не является целью. Схема имеет реальное, четко определенное применение. Классический поиск Google использует его для получения расширенных результатов: цены, рейтинги, время событий, структурированные поля, которые управляют функциями страниц результатов поисковой системы. Граф знаний использует его для устранения неоднозначности сущности. Голосовые помощники извлекают из него структурированные поля.

Ничего из этого не исчезнет. Если вы отвечаете за техническое SEO, продолжайте внедрять схему там, где она приносит пользу.

Schema не может подключиться к преобразователю и улучшить понимание вашей прозы. Модель не предназначена для чтения схемы как схемы. Он получает любой текст, который движок извлек и решил включить, и обрабатывает этот текст как языковые токены. Весь маркетинговый уровень GEO/AEO основан на объединении двух отдельных утверждений: эта схема полезна в классическом поиске и эта схема используется для LLM. Первое верно. Второе — ошибка категории.

Разбиение на фрагменты не входит в ваши обязанности по оптимизации

<п>

Изображение предоставлено: Педро Диас

Советы по фрагментированию продолжают появляться снова, потому что они звучат технически, аккуратно вписываются в блок-схему и дают команде по контенту что-то конкретное, что нужно сделать в понедельник утром. Это также бессвязно.

<п>Разбиение на части происходит во время извлечения. Perplexity, ChatGPT и Gemini запускают средство извлечения документов-кандидатов, разделяют их в соответствии со своими собственными конфигурациями (длина, перекрытие, модель внедрения, иногда семантические границы) и передают фрагменты top-k в контекст модели. Эти конфигурации принадлежат движку. Они настраиваются по-разному в разных системах и перенастраиваются по расписанию, на которое не имеет права ни один издатель. Взгляд издателя на блокировщик — это взгляд издателя на модель: черный ящик, только результаты.

Поэтому, когда поставщик говорит “оптимизировать для извлечения на уровне фрагментов” на самом деле рекомендуется хорошее письмо. Короткие, самостоятельные абзацы. Четкие определения в верхней части разделов. Внутренняя логическая структура. Это узнаваемые дисциплины: информационная архитектура, техническое письмо, читабельность. Они были узнаваемыми дисциплинами задолго до изобретения трансформатора. Это не новый технический уровень.

<п>Более честная версия предложения была бы такой: наймите кого-нибудь, кто умеет писать для Интернета. Это предложение не помещается на странице с ценами.

Бумага, которую они не читают

<стр>Есть настоящая научная статья под названием “GEO.” Аггарвал и соавторы, KDD 2024. Это самый близкий к цитируемому источнику источник SaaS, когда он продает генеративную оптимизацию двигателей как дисциплину. Кроме того, как и в случае с бумагами, их легко просмотреть. Девять «методов оптимизации» протестированы на тесте из 10 000 запросов и дали результаты.

<стр>Что, по мнению статьи, сработало? <стр>Что проверила бумага и обнаружила, что это не помогло? <п>Наполнение ключевыми словами, самый близкий аналог в статье учебнику эпохи SEO, который переупаковали нынешние поставщики GEO и AEO. Результат: ниже базовой линии. Авторы статьи прямо отмечают, что методы, эффективные в поисковых системах, «не могут привести к успеху в этой новой парадигме».

Обратите внимание на то, чего нет в списке из девяти методов. Схема. Структурированные данные. Разметка FAQ. Иерархия заголовков. Машиночитаемые форматы. Ни один из них не тестируется в статье, поскольку ни один из них не является поверхностью оптимизации исследования. В статье изучаются вмешательства на уровне содержания: то, что вы вкладываете в слова, а не метаданные, наслоенные вокруг слов. <п>Уровень SaaS позаимствовал эту аббревиатуру. Выводы остались в документе. “Техническая геопозиция” это руководство по SEO с разными наклейками на одних и тех же коробках, продаваемое вопреки исследованиям, которые указывают на обратное.

Успение тайно пронесено

Предложение SaaS имеет смысл только в том случае, если вы протаскиваете одно предположение: система, для которой вы оптимизируете, имеет ту же форму, что и та, которая выставляет счета SEO-клиентам на протяжении четверти века. Входы, которыми вы управляете. Выходы, которые отвечают. Восстанавливаемая причинно-следственная цепочка между ними.

Эта модель всегда была упрощением работы поиска. Это было достаточно близко, чтобы обеспечить работу отрасли, и достаточно близко, чтобы обеспечить выставление счетов.

<п>Ни одно из этих упрощений не выдерживает контакта с генеративными системами. Один и тот же запрос дает разные ответы в зависимости от сеансов, пользователей, температур, версий модели и дней. Наблюдаемое поведение основных двигателей, а не чистое свойство какого-либо одного. Слой поиска перед моделью также перемещается: смещаются источники-кандидаты, сдвигаются рейтинги, сдвигаются окна свежести. Никакой причинно-следственной связи между фразами «Я добавил схему часто задаваемых вопросов» и «Я добавил схему часто задаваемых вопросов» не существует. и «модель процитировала мою страницу». Между ними проходит распределение вероятностей, и то, что вы контролируете, влияет на это распределение таким образом, что никто не может его точно объяснить. Даже люди, создавшие эти системы.

<п>Это общепринятая линия в отношении инструментов видимости ИИ, повторяемая здесь, поскольку она применима ко всему предписывающему уровню. Статистически непроверяемые данные, полученные из недетерминированных систем. Рост цитируемости на 13 %, измеряемый тем, как, по сравнению с каким контрфактом и с какой воспроизводимостью? Методологические вопросы не являются тем, на что эти цифры призваны ответить. Цифры — это ответ. Они отображаются на графике, отображаются как рентабельность инвестиций на доске, и разговор продолжается. <ч2>Что сказать на встрече

Вот та часть, которую аргументы архитектуры и аргументы методологии сами по себе не объясняют. Почему весь слой SaaS продолжает успешно продавать эти вещи неглупым людям?

<п>Честная версия ответа звучит примерно так: мы работаем с ограниченной прозрачностью в системе, которая не раскрывает свои механизмы, которая возвращает разные результаты разным людям по одному и тому же запросу, которая меняется месяц за месяцем и которая превратила значительную часть воронки в черный ящик. Мы можем продолжать делать работу, которая всегда была работой: хорошо писать, быть полезными, укреплять авторитет, поддерживать сайт. Мы можем отслеживать, что и где появляется. Детерминированная панель управления, которая у нас была раньше, больше не вернется.

Это предложение невозможно произнести на маркетинговом совещании. Он признает, что рычаг не подключен. Он сообщает руководству, что утвержденная бюджетная статья не имеет соответствующего действия. Это не дает команде ничего, что можно было бы включить в план на следующий квартал.

<п>Таким образом, уровень SaaS заполняет этот пробел. Он производит рычаги. Компоненты, фреймворки, процентные подъемы, аудит схем, оптимизация фрагментов, машиночитаемые форматы. Подотчетная деятельность. Оправданные расходы. Есть что сказать на собрании. Ничто из этого не дает вам видимости. Это решает двигатель. Что предлагается, так это видимость контроля, проданная людям, которые скорее заплатят, чем признают, что контроль покинул комнату.

<п>После того как рычаг куплен, им нужно управлять. Аудит схемы запланирован. Контрольные списки фрагментов проверяются. Вероятность цитирования отслеживается, обновляется и сравнивается. Панель мониторинга, за которую команда заплатила, становится панелью мониторинга, которую команда оптимизирует, и панель мониторинга незаметно заменяет реальную проблему той частью проблемы, которую она может видеть. К тому времени, когда кто-нибудь это заметит, слой SaaS напишет письмо.

<стр>Все это не является моральным провалом со стороны покупателя. То, что вы наблюдаете, — это то, что происходит, когда в течение четверти века индустрия была организована на основе предпосылки, что вы можете потянуть за рычаг и наблюдать за движением счетчика, а счетчик незаметно отсоединяется от рычага. Продавцы не занимаются мошенничеством. Они удовлетворяют спрос на единственное, без чего покупатель больше не может себе позволить: ответ, который умещается на слайде. <х2>Rank And Tank, All Over Again

<стр>Я все время возвращаюсь к фразе, которая подходит ко всему этому моменту: танцы под мелодии солдат и танкистов (я позаимствовал ее у Дэвида МакСвини). Цикл таков: поставщик продает структуру контролируемой дисциплины, агентства принимают ее, команды по контенту масштабируют производство вокруг рецептов, статьи, созданные с помощью ИИ, выпускаются в больших объемах, потому что рецепты легко шаблонизировать. Some of it ranks for a while. Большая часть из них в конечном итоге сходит на нет, потому что предписания никогда не были механизмом, и двигатель приспосабливается, или окно свежести закрывается, или система просто продолжает двигаться дальше.

<п>SEO-индустрия уже делала это раньше. Спиннинг. Массовые программные страницы. Содержимое дорвея. Каждый цикл имел одну и ту же форму: контролируемый ввод, оформленный как дисциплина, продаваемый в больших масштабах, кратковременно эффективный, в конечном итоге наказываемый двигателем, заменяемый следующим контролируемым вводом, одетым как дисциплина.

GEO и AEO — текущий цикл. Столпы, проценты и пирамиды — это шаблоны этого цикла. Под ними стратегии раздваиваются.

Один путь – эксплуатация присутствия бренда. Поместите свое имя там, где смотрят двигатели. Темы Reddit, списки Top-X, одни и те же цитаты появляются снова и снова. Цикл питает сам себя: двигатели цитируют поверхности, бренды обрабатывают поверхности, поверхности питают двигатели. Я уже писал об этом цикле; Я назвал это паттерном Уроборос. Вкратце, цикл менее стабилен, чем предполагает стратегия.

<п>Другой путь — контент в масштабе. Создавайте вариации, наращивайте объемы, рассматривайте шаблонные результаты как контент, который может заработать цитирование. Я уже писал об этом подходе в статье “Масштабирование разочарования” кусок. Вкратце, уникальность ничего не стоит, и при тех темпах, которые позволяют эти предписания, качественный анализ становится невозможным. Объем копий, созданных ИИ по этому пути, является внешним эффектом этого цикла.

Забудьте на секунду, есть ли у вас “Technical GEO” настроен правильно. Спросите, стоит ли читать то, что вы размещаете на странице. Большие языковые модели были разработаны для чтения всего, что там есть. Если там что-то хорошее, то это будут читать. Если то, что там есть, представляет собой шаблонный, малополезный контент, оптимизированный с помощью несуществующей эвристики фрагментирования, он в конечном итоге будет отфильтрован: движком, пользователем или следующей научной статьей, показывающей, что качество поиска ухудшается именно из-за такого рода ошибок.

Преимущество, когда оно будет получено, достанется тем людям, которые не отвлекаются. Кто не подписывается на личный кабинет. Кто продолжает работать над SEO, ориентированным на продукты, и над основами, которые всегда связывали контент с людьми. На графиках, которые я читал, есть первые признаки этого. Практики открыто задаются вопросом, имеет ли вообще смысл оптимизация на недетерминированной поверхности, и задаются вопросом, принадлежит ли их внимание классическому поиску; что, в конце цепочки, и есть то, что питает эти системы.

Беспорядок всегда был в центре внимания. Архитектура с этим справляется. Промышленности просто нужно перестать притворяться, что проблема в беспорядке.

Этот пост был первоначально опубликован на The Inference.