Google анонсирует два новых сканера, предназначенных для сбора изображений и видео в целях исследований и разработок
Google раскрыл подробности о двух новых сканерах, оптимизированных для сбора изображений и видеоконтента для “исследований и разработок” целей. Хотя в документации об этом прямо не говорится, предполагается, что это не повлияет на рейтинг, если издатели решат заблокировать новых сканеров.
<п>Следует отметить, что данные, собираемые этими сканерами, не предназначены специально для данных обучения ИИ, для этого и предназначен сканер Google-Extended.
Другие краулеры Google
Два новых сканера представляют собой версии сканера GoogleOther от Google, который был запущен в апреле 2023 года. Исходный сканер GoogleOther также предназначался для использования группами разработчиков продуктов Google для исследований и разработок в так называемой области: разовые сканирования, описание которых дает подсказку о том, для чего будут использоваться новые варианты GoogleOther.
<п>Цель оригинального сканера GoogleOther официально описана как:
.
“GoogleOther – это универсальный сканер, который может использоваться различными группами разработчиков для получения общедоступного контента с сайтов. Например, его можно использовать для разового сканирования для внутренних исследований и разработок.”
Два варианта GoogleOther
Появилось два новых сканера GoogleOther:
<ул>
мл> <п>Новые варианты предназначены для сканирования двоичных данных, то есть данных, не являющихся текстом. Данные HTML обычно называются текстовыми файлами, файлами ASCII или Unicode. Если его можно просмотреть в текстовом файле, то это текстовый файл/файл ASCII/Unicode. Двоичные файлы — это файлы, которые нельзя открыть в приложении для просмотра текста, например файлы изображений, аудио и видео.
<п>Новые варианты GoogleOther предназначены для изображений и видеоконтента. Google перечисляет токены пользовательских агентов для обоих новых сканеров, которые можно использовать в файле robots.txt для блокировки новых сканеров.
<х3>1. GoogleOther-Image
Токены пользовательского агента:
<ул>
мл>
Полная строка пользовательского агента:
GoogleOther-Image/1.0
<х3>2. GoogleДругое видео
Токены пользовательского агента:
<ул>
мл>
Полная строка пользовательского агента:
GoogleOther-Video/1.0
Недавно обновленные строки GoogleДругого пользовательского агента
<п>Google также обновил строки пользовательского агента GoogleOther для обычного сканера GoogleOther. В целях блокировки вы можете продолжать использовать тот же токен пользовательского агента, что и раньше (GoogleOther). Новые строки Users Agent — это просто данные, отправляемые на серверы для идентификации полного описания сканеров, в частности, используемой технологии. В данном случае используется технология Chrome, при этом номер модели периодически обновляется, чтобы указать, какая версия используется (W.X.Y.Z — это заполнитель номера версии Chrome в приведенном ниже примере)
Полный список строк пользовательского агента GoogleOther:
<ул>
мл>
GoogleДругое семейство ботов
Эти новые боты могут время от времени появляться в журналах вашего сервера, и эта информация поможет идентифицировать их как подлинных сканеров Google, а также поможет издателям, которые могут отказаться от очистки их изображений и видео. для целей исследований и разработок.