<стр>Гэри Илайс из Google назвал несколько причин ужасных ошибок сканирования, но не индексированиястр>
Еще в мае Гэри Иллис из Google дал интервью на конференции SERP Conf 2024 в Болгарии и ответил на вопрос о причинах сканирования, но не индексирования, назвав несколько причин, которые помогут при отладке. и исправление этой ошибки.
Хотя интервью состоялось в мае, о видео интервью не сообщалось, и немногие люди его смотрели. Я услышал об этом только потому, что всегда замечательная Олеся Коробка (@Giridja) недавно обратила внимание на интервью в посте на Facebook.
<стр>Так что, несмотря на то, что интервью состоялось в мае, информация по-прежнему актуальна и полезна.стр>
Причина сканирования – В настоящее время не индексируется
Сканировано в настоящее время не проиндексировано — это ссылка на отчет об ошибке в отчете об индексировании страниц консоли поиска Google, который предупреждает, что страница была просканирована Google, но не была проиндексирована.
Во время интервью в прямом эфире кто-то задал вопрос:
“Может сканироваться, но не индексироваться из-за того, что страница слишком похожа на другие уже проиндексированные материалы?
Значит, Google предполагает, что уже достаточно другого материала, а ваш материал недостаточно уникален?”
<п>Документация консоли поиска Google не дает ответа на вопрос, почему Google может сканировать страницу и не индексировать ее, так что это закономерный вопрос.
Гэри Иллис ответил, что да, одной из причин может быть то, что уже существует другой похожий контент. Но он также говорит, что есть и другие причины.
<п><эм>Он ответил:эм>п> <блоковая цитата><п>“Да, это может быть одно из того, что это может означать. Просканировано, но не проиндексировано. В идеале мы бы разбили эту категорию на более детальные фрагменты, но это очень сложно из-за внутреннего существования данных.
Это может быть куча вещей. Устранение дубликатов — это одна из тех вещей, когда мы сканируем страницу, а затем решаем не индексировать ее, потому что уже существует такая версия или чрезвычайно аналогичная версия этого контента доступна в нашем индексе и имеет лучшие сигналы.
Но да, но это может быть несколько вещей.”
Общее качество сайта может повлиять на индексацию
<п>Затем Гэри обратил внимание на еще одну причину, по которой Google может сканировать, но не индексировать сайт, заявив, что это может быть проблемой качества сайта.
Иллес продолжил свой ответ:
“И общее качество сайта, которое может иметь большое значение, поскольку количество просканированных, но не проиндексированных сайтов вы видите в консоли поиска. Если количество этих URL-адресов очень велико, это может указывать на общие проблемы с качеством.
И я часто видел это с февраля, когда мы внезапно решили, что индексируем огромное количество URL-адресов на сайте только потому, что …наше восприятие сайта изменилось .”
Другие причины сканирования и неиндексации
<п>Затем Гэри предложил другие причины, по которым URL-адреса могут сканироваться, но не индексироваться, заявив, что, возможно, восприятие сайта Google могло измениться, но это может быть техническая проблема.
Гэри объяснил:
“…И одна из возможностей заключается в том, что, когда вы видите, что это число растет, восприятие … Восприятие сайта Google изменилось, это может быть одно.
<п>Но может быть также, что произошла ошибка, например, на сайте, а затем была показана одна и та же страница для каждого URL-адреса на сайте. Это также может быть одной из причин роста этого числа.
Так что да, всего может быть много.”
<ч2>Выносч2>
Гэри предоставил ответы, которые должны помочь разобраться, почему веб-страница может сканироваться, но не индексироваться Google.
<ул>
мкл>
Хотя Иллиес не уточнил, что он имел в виду, говоря о другом сайте с лучшими сигналами, я вполне уверен, что он описывает сценарий, когда один сайт объединяет свой контент с другим сайт, и Google решает ранжировать по контенту другой сайт, а не оригинального издателя.
Посмотрите, как Гэри отвечает на этот вопрос на 9-й минуте записанного интервью: