Google объясняет, почему его сканер игнорирует подсказки к вашим ресурсам

Подсказки по ресурсам, такие как предварительная выборка, предварительная загрузка и предварительное подключение, не имеют отношения к инфраструктуре сканирования Google.
Метатеги и элементы ссылок, содержащие директивы поисковой системы, относятся к заголовку.
Достоверность HTML не является сигналом ранжирования.

Гэри Иллис из Google поясняет, почему подсказки ресурсов не влияют на поведение робота Googlebot при сканировании, и отмечает, что валидность HTML не является фактором ранжирования.

Гэри Иллис и Мартин Сплитт из Google использовали эпизод подкаста Search Off the Record, чтобы рассказать, как сканер Google обрабатывает HTML. В ходе беседы были выявлены различия между тем, как браузеры и робот Googlebot обрабатывают одну и ту же страницу.

<п>Обсуждение касалось подсказок по ресурсам, размещения метаданных и проверки HTML. Некоторые из Иллиеса’ объяснения бросают вызов предположениям о том, какие технические изменения помогают в поиске.

Почему подсказки ресурсов не помогают роботу Google

Функции производительности браузера, такие как DNS-prefetch, preload, prefetch и preconnect, решают проблемы с задержкой, которых нет в инфраструктуре Google.

Иллес сказал, что разрешение DNS Google не нуждается в помощи, которую пытается предоставить большинство сайтов.

Он заявил:

“Это очень полезно, если у вас плохой Интернет, например, для предварительной выборки DNS. В нашем случае в этом нет необходимости, поскольку мы можем очень быстро обмениваться данными со всеми каскадными DNS-серверами.”

Он добавил, что Google кэширует ресурсы страниц отдельно и не извлекает их в реальном времени, как это делает браузер. Иллиес сказал, что Google делает это, чтобы уменьшить пропускную способность и нагрузку на серверы на сайтах, которые он сканирует.

<п>Иллиес сказал:

“То же самое с предварительной загрузкой. Если мы не синхронны, то нам особо не нужно прислушиваться и смотреть на предварительную загрузку.”

И Иллиес, и Сплитт ясно дали понять, что эти подсказки по-прежнему помогают пользователям. Более быстрая загрузка страниц улучшает удержание и конверсию. Разница в том, что эти изменения влияют на работу браузера, а не на сканирование или индексирование.

Метаданные принадлежат голове

<п>Сплитт поделился случаем, когда тег сценария, соответствующий спецификации, в заголовке вставил iframe, что вызвало закрытие заголовка браузера. В результате теги ссылок hreflang были помещены в тело текста, и Сплитт сказал, что системы Google правильно их проигнорировали.

Иллес объяснил, почему Google строг в этом отношении. Мета-тег name=”robots”, согласно стандарту жизни HTML, может появляться только в заголовке. То же самое относится и к элементам rel=canonical link.

<п>Он сказал:

“Я бы сказал, что очень опасно иметь элементы ссылок, содержащие метаданные в теле.”

Он аргументирует это тем, что если бы Google принял канонические теги в теле текста, можно было бы перехватить каноничность этой страницы и удалить ее из результатов поиска, внедрив разметку.

Достоверность HTML не равна преимуществу в рейтинге

Иллиес прямо говорил о том, почему валидный HTML не может быть сигналом ранжирования. Валидность как двоичная, что означает, что она либо действительна, либо нет, и между ними нет места. Иллиес сказал, что с помощью показателя «прошел/не прошел» трудно сделать что-то значимое.

“Очень сложно сказать, что что-то близко к достоверному. А потом, что вы делаете, когда что-то почти достоверно.”

<п>Он привел пример того, что отсутствие закрывающего тега span делает HTML страницы технически недействительным, но, как выразился Иллиес, «это ничего не изменит для пользователя».

Сплитт согласился, отметив, что семантическая разметка, такая как правильная иерархия заголовков и структурные элементы HTML5, также не имеет значимого значения для поисковых систем, хотя она полезна для доступности и удобства пользователя.

Почему это важно

Технические проверки могут выявить возможности подсказок ресурсов и ошибки проверки HTML. Знание того, какие из них влияют на сканер Google, а какие на браузеры, поможет вам расставить приоритеты в исправлении.

Когда теги hreflang, канонические ссылки или директивы мета-роботов не работают должным образом, в первую очередь нужно проверить, попадают ли они в тело сообщения после того, как браузер проанализировал страницу. Тег, который выглядит правильно в исходном HTML, может оказаться в неправильном месте, если скрипт или iframe инициирует досрочное закрытие заголовка.

Роджер Монтти рассказал об обновленном руководстве Google по кэшированию сканеров, в котором рекомендуются заголовки ETag для уменьшения ненужного сканирования. Это руководство соответствует тому, что Иллиес описал в этом эпизоде.

<ч2>Взгляд в будущее

Сплитт упомянул, что подсказки клиента были исходной темой, которую он хотел осветить, и что обсуждение анализа HTML стало основой для будущего эпизода. Если этот эпизод произойдет, он может рассказать о том, как Googlebot обрабатывает новые заголовки Accept-CH и Sec-CH-UA, которые заменяют традиционные строки пользовательского агента.

<стр>Полную версию разговора можно найти на YouTube и в Apple Podcasts.