Google объясняет, как он выбирает канонические веб-страницы

Google объясняет, как он выбирает канонические веб-страницы

<стр>Гэри Иллис из Google описывает сигналы, которые Google использует для выбора канонических страниц, и объясняет, почему дублирующиеся страницы могут быть важны для SEO

<п>В видеоролике Google Search Central Гэри Иллис из Google объяснил часть индексации веб-страницы, которая включает в себя выбор канонических значений, объяснение того, что каноническое означает для Google, миниатюрное объяснение сигналов веб-страницы, он упоминает центральную часть страницы и рассказывает, что она делает. с дубликатами, что подразумевает новый способ мышления о них.

Что такое каноническая веб-страница?

Существует несколько способов рассмотрения того, что означает канонический, точка зрения издателя и SEO с нашей стороны окна поиска, и что означает канонический со стороны Google.< /п><стр>Издатели определяют то, что, по их мнению, является “оригинальным” Концепция канонических веб-страниц и SEO-специалистов заключается в выборе “самых сильных” версия веб-страницы для целей ранжирования.

Канонизация для Google – это совсем не то, что думают издатели и оптимизаторы по поисковой оптимизации, поэтому приятно услышать это от такого сотрудника Google, как Гэри Иллис.

Официальная документация Google по канонизации использует слово дедупликация для обозначения процесса выбора каноничности и перечисляет пять типичных причин, по которым на сайте могут быть дублирующиеся страницы.

Пять причин дублирования страниц

<блоковая цитата> <ол> <ли>“Региональные варианты: например, часть контента для США и Великобритании, доступная с разных URL-адресов, но по сути один и тот же контент на одном и том же языке

  • Варианты устройств: например, страница с мобильной и настольной версией
  • Варианты протокола: например, версии сайта HTTP и HTTPS
  • Функции сайта: например, результаты функций сортировки и фильтрации страницы категории
  • Случайные варианты: например, демо-версия сайта случайно оставлена ​​доступной для сканеров”
  • Каноники можно рассматривать тремя разными способами, и существует как минимум пять причин дублирования страниц.

    <с>Гэри описывает еще один способ мышления о канонах.

    Сигналы используются для выбора канонических сигналов

    Ильес делится еще одним определением канонических чисел, на этот раз с точки зрения индексации, и рассказывает о сигналах, которые используются для выбора канонических чисел.

    Гэри объясняет:

    “Google определяет, является ли страница дубликатом другой уже известной страницы, и какую версию следует хранить в индексе, каноническую версию.

    Но в этом контексте каноническая версия — это страница из группы повторяющихся страниц, которая лучше всего представляет группу в соответствии с сигналами, которые мы собрали о каждой версии.”< /p>

    Гэри останавливается, чтобы объяснить кластеризацию дубликатов, а затем через некоторое время возвращается к разговору о сигналах.

    Он продолжил:

    “По большей части в результатах поиска появляются только канонические страницы. Но как нам узнать, какая страница каноническая?

    <п>Поэтому, как только Google получит содержимое вашей страницы или, точнее, основной контент или центральную часть страницы, он сгруппирует его с одной или несколькими страницами с похожим контентом, если таковые имеются. Это кластеризация дубликатов.”

    <стр>Хочу здесь остановиться и отметить, что Гэри называет основной контент “центральным элементом страницы” Это интересно, потому что существует концепция, предложенная Мартином Сплиттом из Google, под названием «Центральная аннотация». Он толком не объяснил, что такое Центральная аннотация, но то, чем поделился Гэри, помогает. <стр>Далее представлена ​​часть видео, где Гэри рассказывает о том, что такое сигналы на самом деле. <п><сильный>Иллиес объясняет, какие “сигналы” являются:

    “Затем он сравнивает несколько сигналов, которые уже вычислил для каждой страницы, чтобы выбрать каноническую версию.

    Сигналы — это фрагменты информации, которую поисковая система собирает о страницах и веб-сайтах и ​​которые используются для дальнейшей обработки.

    Некоторые сигналы очень просты, например аннотации владельца сайта в HTML, такие как rel=”canonical”, тогда как другие, например важность отдельной страницы в Интернете, менее очевидны. ”

    Дубликаты кластеров имеют один канонический

    Гэри далее объясняет, что одна страница выбирается для представления канонической для каждого кластера повторяющихся страниц в результатах поиска. В каждом кластере дубликатов есть один канонический.

    <п><эм>Он продолжает:

    “Каждый из повторяющихся кластеров будет содержать одну версию контента, выбранную как каноническую.

    Эта версия будет представлять контент в результатах поиска для всех остальных версий.

    Другие версии в кластере становятся альтернативными версиями, которые могут обслуживаться в разных контекстах, например, если пользователь ищет очень специфическую страницу в кластере.”

    Альтернативные версии веб-страниц

    <п>Последняя часть действительно интересна и ее важно учитывать, поскольку она может быть полезна для возможности ранжироваться по нескольким вариантам ключевого слова, особенно для веб-страниц электронной коммерции.

    Иногда система управления контентом (CMS) создает дубликаты веб-страниц для учета вариаций продукта, таких как размер или цвет продукта, которые затем могут повлиять на описание. Эти варианты могут быть выбраны Google для ранжирования в результатах поиска, когда эта вариантная страница более точно соответствует поисковому запросу.

    <п>Об этом важно подумать, потому что может возникнуть соблазн перенаправить веб-страницы с вариантами noindex, чтобы исключить их из поискового индекса из-за страха перед (несуществующей) проблемой каннибализации ключевых слов. Добавление noindex к страницам, которые являются вариантами одной страницы, может иметь неприятные последствия, поскольку существуют сценарии, когда эти варианты страниц лучше всего ранжируются по более тонкому поисковому запросу, который содержит цвета, размеры или номера версий, которые отличаются от канонической страницы.

    Главные выводы о канониках (и не только), которые стоит запомнить

    <стр>В обсуждениях Гэри канонических текстов содержится много информации, включая некоторые второстепенные темы об основном содержании.

    Вот семь выводов, которые следует учитывать:

    <ол>

  • Основной контент называется Центральным элементом
  • Google рассчитывает “несколько сигналов” за каждую обнаруженную страницу.
  • Сигналы — это данные, которые используются для “дальнейшей обработки” после обнаружения веб-страниц.
  • Некоторые сигналы контролируются издателем, например, подсказки (и, предположительно, директивы). Подсказка, которую упомянул Иллиес, — это атрибут ссылки rel=canonical.
  • Другие сигналы находятся вне контроля издателя, например, важность страницы в контексте Интернета.
  • Некоторые дубликаты страниц могут служить альтернативными версиями
  • Альтернативные версии веб-страниц по-прежнему могут ранжироваться и полезны для Google (и издателя) для целей ранжирования.
  • Посмотрите эпизод Search Central об индексировании:

    Back To Top