<стр>Углубитесь в взаимосвязь между данными общего сканирования и обзорами ИИ.стр>
<стр>В продолжение моего первого анализа более 546 000 обзоров ИИ я углубляюсь в три вопроса:стр> <ол>
ол>
Как связаны общие данные сканирования и обзоры ИИ?
Включение общего сканирования не влияет на видимость AIO так сильно, как чистый органический трафик.
Common Crawl, некоммерческая организация, которая сканирует Интернет и бесплатно предоставляет данные, является крупнейшим источником данных для обучения генеративному ИИ.
Некоторые сайты, такие как Blogspot, предоставляют гораздо больше страниц, чем другие, что поднимает вопрос, дает ли это им преимущество в ответах на степень LLM.
Результат: Мне интересно, будут ли сайты, которые предоставляют больше страниц, чем другие, также более заметными в обзорах ИИ. Это оказалось неправдой.
Я сравнил 500 лучших доменов по вкладу страниц в Common Crawl с 30 000 лучших доменов в моем наборе данных и обнаружил слабую корреляцию 0,179.
Причина в том, что Google, вероятно, полагается не на Common Crawl для обучения и информирования обзоров ИИ, а на свой собственный индекс.
Изображение предоставлено: Кевин Индиг
Затем я проанализировал взаимосвязь между 3000 доменами с наибольшим количеством органического трафика из Semrush и 30 000 доменами с наибольшим количеством трафика в моем наборе данных и обнаружил сильную связь 0,714.
.
Другими словами, домены, которые получают много органического трафика, с высокой вероятностью будут заметны в обзорах ИИ.
AIO, кажется, все больше вознаграждает то, что работает в органическом поиске, но некоторые критерии все еще очень разные.
Важно отметить, что некоторые сайты искажают взаимосвязь.
При фильтрации Википедии и YouTube корреляция снижается до 0,485 – все еще сильный, но ниже, чем у двух гигантов.
<п>Корреляция не меняется при удалении более крупных сайтов, что подтверждает тот факт, что работа, которая работает в обычном поиске, оказывает большое влияние на обзоры ИИ.стр>
Как я писал в предыдущем посте:
Более высокий рейтинг в результатах поиска, безусловно, увеличивает шансы быть видимым в AIO, но это далеко не единственный фактор.
блоковая>
В результате компании могут исключить бота Common Crawl из robots.txt, если они не хотят появляться в общедоступных наборах данных (и создавать ИИ, например Chat GPT), и при этом оставаться очень видно в обзорах ИИ Google.
Как намерения пользователя меняют обзоры ИИ?
Намерения пользователя формируют форму и содержание AIO.
В моем предыдущем анализе я пришел к выводу, что точное соответствие запроса не имеет большого значения:Данные показывают, что только 6% AIO содержат поисковый запрос.
Это число немного выше в SGE, 7%, и ниже в действующих AIO, 5,1%. В результате соответствие намерениям пользователя в контенте гораздо важнее, чем мы могли предположить. Это не должно вызывать удивления, поскольку намерения пользователя были ключевым требованием ранжирования в SEO на протяжении многих лет, но данные шокируют.
<п>Вычисление точного (доминирующего) намерения пользователя для всех 546 000 запросов потребовало бы чрезвычайно больших вычислительных ресурсов, поэтому я рассмотрел общие абстракции: информационную, локальную и транзакционную.
Абстракции менее полезны при оптимизации контента, но они хороши при просмотре совокупных данных.
I сгруппировано:
<ул>
Информационные запросы вокруг вопросительных слов, таких как “что,” “почему” “когда” и т. д.ли> Транзакционные запросы вокруг таких слов, как “купить” “скачать” “заказ” и т. д.ли> Локальные запросы вокруг “поблизости” “закрыть” или “рядом со мной” мкл>
Изображение предоставлено: Кевин Индиг
<сильный>Результат:сильный>Различия в намерениях пользователей отражаются в форме и функциях. Средняя длина (количество слов) почти одинакова для всех намерений, кроме локального, что имеет смысл, поскольку пользователям нужен список местоположений, а не текст.
Аналогично, AIO для покупок часто представляют собой списки продуктов с небольшим контекстом, если только это не вопросы, связанные с покупками.
Локальные запросы имеют наибольшее совпадение точного соответствия между запросом и ответом; информационные запросы имеют самый низкий показатель.
<п>Понять и удовлетворить намерения пользователя в отношении вопросов сложнее, но и более важно, чтобы их было видно в AIO, чем, например, в избранных фрагментах.
Как распределяются 20 лучших органических позиций?
В моем последнем анализе я обнаружил, что почти 60% URL-адресов, которые появляются в AIO и результатах обычного поиска, занимают позиции за пределами первых 20 позиций.
В этой заметке я разбил топ-20 дальше, чтобы понять, с большей вероятностью AIO будут цитировать URL-адреса на более высоких позициях или нет.
Изображение предоставлено Кевином Индигом
<сильный>Результат:сильный>Оказывается, 40% URL-адресов в AIO занимают позиции 11–20, и только половина (21,9%) входит в топ-3.
Большинство, 60% URL-адресов, цитируемых в AIO, по-прежнему ранжируются на первой странице органических результатов, что подтверждает тот факт, что более высокий органический рейтинг, как правило, приводит к более высокой вероятности цитирования в AIO.п>
Однако данные также показывают, что практически невозможно присутствовать в AIO с более низким органическим рейтингом.
Где находятся 20 лучших доменов, видимых в AIO и результатах поиска (Изображение предоставлено Кевином Индигом) <ч2>Сценариич2>
Я буду работать со своими клиентами, чтобы соответствовать намерениям пользователей AIO, предоставлять уникальную информацию и адаптировать формат. Я вижу варианты развития обзора ИИ, которые я буду отслеживать и подтверждать данными в ближайшие месяцы и годы.
Вариант 1: AIO больше полагаются на высшие результаты органического поиска и удовлетворяют больше информационных намерений, прежде чем пользователям нужно будет перейти на веб-сайт. Большинство кликов на сайтах приходится на пользователей, которые рассматривают или собираются совершить покупку.
Вариант 2: AIO продолжают предоставлять ответы из разнообразных результатов и оставляют небольшой шанс, что пользователи все равно перейдут к результатам с самым высоким рейтингом, хотя и в гораздо меньших количествах.
На какой сценарий вы ставите?