Google объясняет причины, по которым сканирование не индексируется

Google объясняет причины, по которым сканирование не индексируется

<стр>Гэри Илайс из Google назвал несколько причин ужасных ошибок сканирования, но не индексирования

Еще в мае Гэри Иллис из Google дал интервью на конференции SERP Conf 2024 в Болгарии и ответил на вопрос о причинах сканирования, но не индексирования, назвав несколько причин, которые помогут при отладке. и исправление этой ошибки.

Хотя интервью состоялось в мае, о видео интервью не сообщалось, и немногие люди его смотрели. Я услышал об этом только потому, что всегда замечательная Олеся Коробка (@Giridja) недавно обратила внимание на интервью в посте на Facebook.

<стр>Так что, несмотря на то, что интервью состоялось в мае, информация по-прежнему актуальна и полезна.

Причина сканирования – В настоящее время не индексируется

Сканировано в настоящее время не проиндексировано — это ссылка на отчет об ошибке в отчете об индексировании страниц консоли поиска Google, который предупреждает, что страница была просканирована Google, но не была проиндексирована.

Во время интервью в прямом эфире кто-то задал вопрос:

“Может сканироваться, но не индексироваться из-за того, что страница слишком похожа на другие уже проиндексированные материалы?

Значит, Google предполагает, что уже достаточно другого материала, а ваш материал недостаточно уникален?”

<п>Документация консоли поиска Google не дает ответа на вопрос, почему Google может сканировать страницу и не индексировать ее, так что это закономерный вопрос.

Гэри Иллис ответил, что да, одной из причин может быть то, что уже существует другой похожий контент. Но он также говорит, что есть и другие причины.

<п><эм>Он ответил: <блоковая цитата><п>“Да, это может быть одно из того, что это может означать. Просканировано, но не проиндексировано. В идеале мы бы разбили эту категорию на более детальные фрагменты, но это очень сложно из-за внутреннего существования данных.

Это может быть куча вещей. Устранение дубликатов — это одна из тех вещей, когда мы сканируем страницу, а затем решаем не индексировать ее, потому что уже существует такая версия или чрезвычайно аналогичная версия этого контента доступна в нашем индексе и имеет лучшие сигналы.

Но да, но это может быть несколько вещей.”

Общее качество сайта может повлиять на индексацию

<п>Затем Гэри обратил внимание на еще одну причину, по которой Google может сканировать, но не индексировать сайт, заявив, что это может быть проблемой качества сайта.

Иллес продолжил свой ответ:

“И общее качество сайта, которое может иметь большое значение, поскольку количество просканированных, но не проиндексированных сайтов вы видите в консоли поиска. Если количество этих URL-адресов очень велико, это может указывать на общие проблемы с качеством.

И я часто видел это с февраля, когда мы внезапно решили, что индексируем огромное количество URL-адресов на сайте только потому, что …наше восприятие сайта изменилось .”

Другие причины сканирования и неиндексации

<п>Затем Гэри предложил другие причины, по которым URL-адреса могут сканироваться, но не индексироваться, заявив, что, возможно, восприятие сайта Google могло измениться, но это может быть техническая проблема.

Гэри объяснил:

“…И одна из возможностей заключается в том, что, когда вы видите, что это число растет, восприятие … Восприятие сайта Google изменилось, это может быть одно.

<п>Но может быть также, что произошла ошибка, например, на сайте, а затем была показана одна и та же страница для каждого URL-адреса на сайте. Это также может быть одной из причин роста этого числа.

Так что да, всего может быть много.”

<ч2>Вынос

Гэри предоставил ответы, которые должны помочь разобраться, почему веб-страница может сканироваться, но не индексироваться Google.

<ул>

  • Содержимое похоже на контент, уже ранжированный на страницах результатов поисковых систем (SERP)
  • Точно такой же контент существует на другом сайте с лучшими сигналами
  • Общие проблемы с качеством сайта
  • Технические проблемы
  • Хотя Иллиес не уточнил, что он имел в виду, говоря о другом сайте с лучшими сигналами, я вполне уверен, что он описывает сценарий, когда один сайт объединяет свой контент с другим сайт, и Google решает ранжировать по контенту другой сайт, а не оригинального издателя.

    Посмотрите, как Гэри отвечает на этот вопрос на 9-й минуте записанного интервью: