Google говорит, что вам не нужен файл robots.txt в корневом домене

Гэри Иллис из Google делится нетрадиционным, но действенным методом централизации правил robots.txt в CDN.

Файлы Robots.txt можно централизовать в CDN, а не только в корневых доменах.
Веб-сайты могут перенаправлять файл robots.txt с основного домена на CDN.
Этот нестандартный подход соответствует обновленным стандартам.

В недавнем сообщении на LinkedIn аналитик Google Гэри Иллис бросил вызов давнему мнению о размещении файлов robots.txt.

В течение многих лет общепринятым было то, что файл robots.txt веб-сайта должен находиться в корневом домене (например, example.com/robots.txt).

Однако Иллиес пояснил, что это не является абсолютным требованием, и раскрыл менее известный аспект Протокола исключения роботов (REP).

Гибкость файла Robots.txt

Файл robots.txt не обязательно должен находиться в корневом домене (example.com/robots.txt).

По словам Иллиеса, допустимо иметь два отдельных файла robots.txt, размещенных в разных доменах: один на основном веб-сайте, а другой в сети доставки контента (CDN).

Иллиес объясняет, что веб-сайты могут централизовать свой файл robots.txt в CDN, одновременно контролируя сканирование своего основного сайта.

<п>Например, на веб-сайте может быть два файла robots.txt: один по адресу https://cdn.example.com/robots.txt, а другой по адресу https://www.example.com/robots.txt.

Этот подход позволяет вам поддерживать единый комплексный файл robots.txt в их CDN и перенаправлять запросы с их основного домена в этот централизованный файл.

< /п> <п>Иллиес отмечает, что сканеры, соответствующие RFC9309, будут следовать перенаправлению и использовать целевой файл в качестве файла robotstxt для исходного домена.

Оглядываясь назад на 30 лет Robots.txt

Поскольку в этом году Протоколу исключения роботов исполняется 30 лет, Иллиес’ откровение показывает, как веб-стандарты продолжают развиваться.

Он даже размышляет, нужно ли называть файл “robots.txt,” намекая на возможные изменения в управлении директивами сканирования.

Как это может вам помочь

По следам Иллиеса’ руководство может помочь вам следующим образом:

<ол>

Централизованное управление: Объединив правила файла robots.txt в одном месте, вы можете поддерживать и обновлять директивы сканирования по всему вашему веб-сайту.< /ли>
Улучшенная согласованность: единый источник достоверных данных для правил robots.txt снижает риск конфликта директив между вашим основным сайтом и CDN.
Гибкость: этот подход позволяет создавать более адаптируемые конфигурации, особенно для сайтов со сложной архитектурой или сайтов, использующих несколько поддоменов и CDN.
Оптимизированный подход к управлению файлами robots.txt может улучшить как управление сайтом, так и усилия по поисковой оптимизации.