Google представляет два новых веб-сканера

Google представляет два новых веб-сканера

Google анонсирует два новых сканера, предназначенных для сбора изображений и видео в целях исследований и разработок

Google раскрыл подробности о двух новых сканерах, оптимизированных для сбора изображений и видеоконтента для “исследований и разработок” целей. Хотя в документации об этом прямо не говорится, предполагается, что это не повлияет на рейтинг, если издатели решат заблокировать новых сканеров.

<п>Следует отметить, что данные, собираемые этими сканерами, не предназначены специально для данных обучения ИИ, для этого и предназначен сканер Google-Extended.

Другие краулеры Google

Два новых сканера представляют собой версии сканера GoogleOther от Google, который был запущен в апреле 2023 года. Исходный сканер GoogleOther также предназначался для использования группами разработчиков продуктов Google для исследований и разработок в так называемой области: разовые сканирования, описание которых дает подсказку о том, для чего будут использоваться новые варианты GoogleOther.

<п>Цель оригинального сканера GoogleOther официально описана как:

.

“GoogleOther – это универсальный сканер, который может использоваться различными группами разработчиков для получения общедоступного контента с сайтов. Например, его можно использовать для разового сканирования для внутренних исследований и разработок.”

Два варианта GoogleOther

Появилось два новых сканера GoogleOther:

<ул>

  • GoogleOther-Image
  • GoogleДругое видео
  • <п>Новые варианты предназначены для сканирования двоичных данных, то есть данных, не являющихся текстом. Данные HTML обычно называются текстовыми файлами, файлами ASCII или Unicode. Если его можно просмотреть в текстовом файле, то это текстовый файл/файл ASCII/Unicode. Двоичные файлы — это файлы, которые нельзя открыть в приложении для просмотра текста, например файлы изображений, аудио и видео.

    <п>Новые варианты GoogleOther предназначены для изображений и видеоконтента. Google перечисляет токены пользовательских агентов для обоих новых сканеров, которые можно использовать в файле robots.txt для блокировки новых сканеров.

    <х3>1. GoogleOther-Image

    Токены пользовательского агента:

    <ул>

  • GoogleOther-Image
  • GoogleOther
  • Полная строка пользовательского агента:

    GoogleOther-Image/1.0

    <х3>2. GoogleДругое видео

    Токены пользовательского агента:

    <ул>

  • GoogleДругое видео
  • GoogleOther
  • Полная строка пользовательского агента:

    GoogleOther-Video/1.0

    Недавно обновленные строки GoogleДругого пользовательского агента

    <п>Google также обновил строки пользовательского агента GoogleOther для обычного сканера GoogleOther. В целях блокировки вы можете продолжать использовать тот же токен пользовательского агента, что и раньше (GoogleOther). Новые строки Users Agent — это просто данные, отправляемые на серверы для идентификации полного описания сканеров, в частности, используемой технологии. В данном случае используется технология Chrome, при этом номер модели периодически обновляется, чтобы указать, какая версия используется (W.X.Y.Z — это заполнитель номера версии Chrome в приведенном ниже примере)

    Полный список строк пользовательского агента GoogleOther:

    <ул>

  • Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, например Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (совместимый; GoogleOther)
  • Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; GoogleOther) Chrome/W.X.Y.Z Safari/537.36
  • GoogleДругое семейство ботов

    Эти новые боты могут время от времени появляться в журналах вашего сервера, и эта информация поможет идентифицировать их как подлинных сканеров Google, а также поможет издателям, которые могут отказаться от очистки их изображений и видео. для целей исследований и разработок.

    Прочитайте обновленную документацию по сканеру Google

    Back To Top